Salah satu asumsi yang harus terpenuhi dalam regresi linear adalah linearitas antara variabel prediktor dengan variabel respon. Pada halaman ini, akan dibahas mengenai cara pengujian linearitas model dengan menggunakan software Rtudio.
Data yang digunakan
Dalam analisis ini, data yang digunakan adalah data "marketing" dari packages "datarium". Apabila packages tidak ditemukan, install terlebih dahulu pakages baru kemudian panggil packages dan datanya.
#install packages
install.packages("datarium")
#memanggil packages
library(datarium)
#load data marketing
data("marketing", package = "datarium")
head(marketing,2)
#> youtube facebook newspaper sales
#> 1 276.12 45.36 83.04 26.52
#> 2 53.40 47.16 54.12 12.48
Membuat model regresi
Variabel yang digunakan adalah sales dan youtube, dengan sales sebagai respon dan youtube sebagai prediktor
#model regresi
model = lm(sales~youtube, data = marketing)
#plot linearitas
plot(model,1)
Dari gambar diatas, terlihat tidak terdapat pola garis merah atau garis merah hampir berhimpit dengan garis datar. Hal tersebut menunjukkan bahwa model dapat diasumsikan memenuhi asumsi hubungan linier antara variabel prediktor (youtube) dengan variabel respon (sales).
Menghitung statistik linearitas
Selain cara diatas, uji normalitas dapat dilakukan dengan menghitung signifikansi statistik. Dibutuhkan packages "lmSupport" untuk dapat menjalankan perintah dibawah.
#install packages
install.packages("lmSupport")
#memanggil packages
library(lmSupport)
#melakukan pengujian asumsi linearitas
modelAssumptions(model,Type = 'LINEAR')
#> Call:
#> lm(formula = sales ~ youtube, data = marketing)
#> Coefficients:
#> (Intercept) youtube
#> 8.43911 0.04754
#> ASSESSMENT OF THE LINEAR MODEL ASSUMPTIONS
#> USING THE GLOBAL TEST ON 4 DEGREES-OF-FREEDOM:
#> Level of Significance = 0.05
#> Call:
#> gvlma(x = Model)
#> Value p-value Decision
#> Global Stat 5.3240 0.25564 Assumptions acceptable.
#> Skewness 0.2619 0.60885 Assumptions acceptable.
#> Kurtosis 0.4070 0.52352 Assumptions acceptable.
#> Link Function 3.6906 0.05472 Assumptions acceptable.
#> Heteroscedasticity 0.9646 0.32602 Assumptions acceptable.
Dari output diatas, terlihat bahwa semua asumsi statistik untuk uji linearitas terpenuhi. Hal tersebut menyimpulkan bahwa variabel respon dan prediktor telah memenuhi asumsi linearitas.
Apabila terdapat asumsi yang tidak terpenuhi, maka harus dilakukan preprocessing terhadap data. Salah satu preprocessing yang biasa digunakan adalah transformasi data.
Posting Komentar