The words you are searching are inside this book. To get more targeted content, please make full-text search by clicking here.

How use R Studio for regression and correlation analysis

Discover the best professional documents and content resources in AnyFlip Document Base.
Search
Published by sistinadia, 2022-12-21 04:24:40

How use R Studio for regression and correlation analysis

How use R Studio for regression and correlation analysis

Keywords: R Studio

KATA PENGANTAR
Puji syukur penulis panjatkan kehadirat Allah SWT, karena dengan
pertolongan-Nya penulis dapat menyelesaikan Modul Panduan
Penggunaan R Studio Materi Analisis Regresi dan Korelasi tepat pada
waktunya.
Modul ini merupakan output dari rancangan aktualisasi sebagai
peserta Diklatsar Angkatan XXX Kemendikbud - PPSDM KEBTKE tahun
2022 yang merupakan alternatif pemecahan isu "Minimnya Pengetahuan
dan Keterampilan Mahasiswa terhadap Program Analisis Data Statistika" di
Program Studi Matematika Fakultas Matematika dan Ilmu Pengetahuan
Alam Universitas Negeri Medan
Penulis menyadari bahwa modul ini masih jauh dari kesempurnaan.
Oleh karena itu, penulis mengharapkan saran dan kritik yang membangun
untuk perbaikan modul ini. Semoga modul ini dapat bermaanfaat bagi
semua pihak.

Medan, November 2022

Sisti Nadia Amalia

i

DAFTAR ISI

KATA PENGANTAR ...................................................................................i
DAFTAR ISI...............................................................................................ii
DAFTAR GAMBAR...................................................................................iv
DAFTAR TABEL.......................................................................................vi
BAB 1 PENGANTAR DAN INSTALASI R DAN R STUDIO ....................... 1

1. 1. Pengantar R dan R Studio .......................................................... 1
1. 2. Instalasi R dan Memulai R .......................................................... 3
1. 3. Instalasi R Studio dan Memulai R Studio .................................... 5
1. 4. Penggunaan RStudio.................................................................. 6
1.5 Latihan ..................................................................................... 10
BAB 2 DASAR PEMROGRAMAN R STUDIO......................................... 11
2.1. Assignment (Penugasan) dalam R ........................................... 11
2.2. Penamaan Objek...................................................................... 12
2.3. Vector ....................................................................................... 12
2.4. Factor ....................................................................................... 15
2.5. Matriks...................................................................................... 16
2.6. Array......................................................................................... 18
2.7. Data Frame .............................................................................. 18
2.8. List............................................................................................ 20
2.9. Function dan Packages ............................................................ 21
2.10. Mencari Help Sebuah Fungsi.................................................... 24
2.11. Importing Dataset pada RStudio ............................................... 26
2.12 Latihan ..................................................................................... 28
BAB 3 ANALISIS REGRESI SEDERHANA DENGAN R STUDIO........... 29
3.1 Analisis Regresi Linear Sederhana........................................... 29
3.2 Estimasi Parameter Regresi Linear Sederhana ........................ 29
3.3 Uji Asumsi Klasik Regresi Sederhana....................................... 31
3.4 Uji Kecocokan Model Regresi Sederhana................................. 37
3.5 Uji Signifikansi Parameter Model Regresi Sederhana............... 38
3.6 Interpretasi Model Terbaik Regresi Sederhana......................... 39

ii

3.7 Latihan ..................................................................................... 40
BAB 4 ANALISIS REGRESI BERGANDA DENGAN R STUDIO............. 41

4.1 Analisis Regresi Linier Berganda .............................................. 41
4.2 Estimasi Parameter Regresi Berganda ..................................... 41
4.3 Uji Asumsi Klasik Regresi Berganda......................................... 43
4.4 Uji Kecocokan Model Regresi Berganda ................................. 49
4.5 Uji Signifikansi Parameter Model Regresi Berganda................. 50
4.6 Interpretasi Model Terbaik ........................................................ 51
4.7 Latihan ..................................................................................... 52
BAB 5 ANALISIS KORELASI DENGAN R STUDIO................................ 53
5.1 Analisis Korelasi ....................................................................... 53
5.2 Formula Koefisien Korelasi ....................................................... 53
5.3 Uji Signifikansi Koefisien Korelasi ............................................. 56
5.4 Latihan ..................................................................................... 57
DAFTAR PUSTAKA................................................................................ 58

iii

DAFTAR GAMBAR

Gambar 1. 1 Comprehensive R Archive Network (CRAN) ........................ 3
Gambar 1. 2 Download R Installer ............................................................ 3
Gambar 1. 3 Menu untuk Menjalankan R.................................................. 4
Gambar 1. 4 Tampilan R GUI ................................................................... 4
Gambar 1. 5 Perumpamaan R dan RStudio.............................................. 5
Gambar 1. 6 Menu untuk menjalankan RStudio........................................ 6
Gambar 1. 7 Tampilan R Studio................................................................ 6
Gambar 1. 8 Membuat file kerja baru di R ................................................ 8
Gambar 1. 9 Membuat Script Baru di RStudio .......................................... 8
Gambar 1. 10 Menyimpan File di RStudio ................................................ 9
Gambar 1. 11 Menulis Script di Console................................................... 9
Gambar 1. 12 Menulis Script di Windows Script ..................................... 10

Gambar 2. 1 Assigment <- dalam RStudio.............................................. 11
Gambar 2. 2 Assigment = dalam RStudio ............................................... 11
Gambar 2. 3 Fungsi print() dalam RStudio.............................................. 12
Gambar 2. 4 Membuat vector dengan fungsi c() ..................................... 13
Gambar 2. 5 Memanggil elemen tertentu dari vector .............................. 13
Gambar 2. 6 Membuat vector dengan tanda titik dua.............................. 13
Gambar 2. 7 Membuat vector dengan funsi seq() ................................... 14
Gambar 2. 8 Membuat vector dengan fungsi seq() dan argumen yang
berbeda .................................................................................................. 14
Gambar 2. 9 Fungsi rep() dalam RStudio ............................................... 14
Gambar 2. 10 Vector dengan tipe data character ................................... 14
Gambar 2. 11 Membuat factor dengan fungsi factor() ............................. 15
Gambar 2. 12 Mendefinisikan nilai factor ................................................ 15
Gambar 2. 13 Mendefinisikan levels pada factor .................................... 15
Gambar 2. 14 Membuat matriks dari beberapa vector ............................ 16
Gambar 2. 15 Membuat matriks dengan argumen berbeda .................... 16
Gambar 2. 16 Matriks dengan nilai yang sama ....................................... 17
Gambar 2. 17 Cara mengakses elemen matriks ..................................... 17
Gambar 2. 18 Cara mengakses diagonal matriks ................................... 17
Gambar 2. 19 Contoh array Titanic yang sudah ada pada RStudio ........ 18
Gambar 2. 20 Data frame mtcars pada RStudio ..................................... 19
Gambar 2. 21 Membuat dataframe dari vector........................................ 19
Gambar 2. 22 Dimensi dari data frame ................................................... 20
Gambar 2. 23 Structure data frame ....................................................... 20
Gambar 2. 24 Membuat list dengan fungsi list() ...................................... 21
Gambar 2. 25 Ilustrasi Objek dalam R .................................................... 21
Gambar 2. 26 Contoh fungsi yang sudah ada dalam RStudio................. 22

iv

Gambar 2. 27 Fungsi summary() untuk mencari statistik 5 serangkai ..... 22
Gambar 2. 28 Tab packages pada RStudio ............................................ 23
Gambar 2. 29 Proses instal packages di console ................................... 24
Gambar 2. 30 Hasil help fungsi ?mean ................................................... 25
Gambar 2. 31 Hasil help data ?iris .......................................................... 26
Gambar 2. 32 Import Dataset ke R Studio .............................................. 27
Gambar 2. 33 Memilih jenis sumber data yang akan diimport ................. 27
Gambar 2. 34 Jendela file excel yang akan diimpor ke RStudio ............. 28
Gambar 2. 35 Hasil import file Latihan.xlsx ke dalam RStudio ................ 28
Gambar 3. 1 Grafik Deteksi Residual Berdistribusi Normal .................... 35

v

DAFTAR TABEL

Tabel 3. 1 Contoh Data Regresi Sederhana ........................................... 30
Tabel 3. 2 Syntax Estimasi Parameter Regresi Linear Sederhana .......... 31
Tabel 3. 3 Output Estimasi Parameter Regresi Linear Sederhana .......... 31
Tabel 3. 4 Perhitungan Uji Park .............................................................. 32
Tabel 3. 5 Syntax Uji Heteroskedastisitas ............................................... 33
Tabel 3. 6 Output Uji Heteroskedastisitas ............................................... 33
Tabel 3. 7 Syntax Uji Normalitas............................................................. 35
Tabel 3. 8 Output Uji Normalitas ............................................................. 36
Tabel 3. 9 Syntax Uji Autokorelasi .......................................................... 36
Tabel 3. 10 Output Uji Autokorelasi ........................................................ 36
Tabel 3. 11 Syntax Uji Kecocokan Model................................................ 37
Tabel 3. 12 Output Uji Kecocokan Model................................................ 37
Tabel 3. 13 Syntax Model Terbaik Regresi Sederhana ........................... 38
Tabel 3. 14 Output Model Terbaik Regresi Sederhana ........................... 38

Tabel 4. 1 Contoh Data Regresi Berganda ............................................. 42
Tabel 4. 2 Syntax Estimasi Parameter Regresi Linear Berganda............ 43
Tabel 4. 3 Output Estimasi Parameter Regresi Linear Berganda ........... 43
Tabel 4. 4 Perhitungan Uji Park ............................................................. 44
Tabel 4. 5 Syntax Uji Heteroskedastisitas .............................................. 45
Tabel 4. 6 Output Uji Heteroskedastisitas .............................................. 45
Tabel 4. 7 Syntax Uji Normalitas............................................................ 46
Tabel 4. 8 Output Uji Normalitas ............................................................ 46
Tabel 4. 9 Syntax Uji Autokorelasi ......................................................... 47
Tabel 4. 10 Output Uji Autokorelasi ....................................................... 47
Tabel 4. 11 Syntax Uji Multikolinieritas ................................................... 48
Tabel 4. 12 Output Uji Multikolinieritas ................................................... 48
Tabel 4. 13 Syntax Uji Kecocokan Model ............................................... 49
Tabel 4. 14 Output Uji Kecocokan Model ............................................... 49
Tabel 4. 15 Syntax Model Terbaik Regresi Berganda ............................ 50
Tabel 4. 16 Output Model Terbaik Regresi Berganda ............................ 50

vi

Tabel 5. 1 Kriteria Koefisien Korelasi………………………………………..54
Tabel 5. 2 Contoh Data Korelasi ............................................................. 54
Tabel 5. 3 Syntax Uji Normalitas ............................................................. 55
Tabel 5. 4 Output Uji Normalitas ............................................................. 55
Tabel 5. 5 Syntax Korelasi Pearson........................................................ 56
Tabel 5. 6 Output Korelasi Pearson ........................................................ 56
Tabel 5. 7 Syntax Uji Signifikansi Koefisien Korelasi............................... 56
Tabel 5. 8 Output Uji Signifikansi Koefisien Korelasi............................... 56

vii

BAB 1
PENGANTAR DAN INSTALASI R DAN R STUDIO

Capaian Pembelajaran Mata Kuliah :
Mengenal bahasa R dan R Studio sebagai alat bantu analisis data
statistika

Sub Capaian Pembelajaran Mata Kuliah :
1. Memahami perbedaan R dan R Studio
2. Mampu melakukan instalasi R dan R Studio secara mandiri
3. Memahami cara memulai dan menutup R Studio
4. Memahami tampilan antarmuka R Studio
5. Memahami cara menggunakan R Studio

1. 1. Pengantar R dan R Studio
R merupakan sebuah program komputasi statistika dan grafis (R

Core Team 2020). Saat ini R sudah dikenal luas sebagai salah
satu powerful software untuk analisis data. Selain daripada itu, R
termasuk kedalam salah satu kategori open source software. Sehingga R
sangat fleksibel untuk dikembangakn sesuai dengan kebutuhan pengguna.
Hal tersebut membuat cakupan kemampuan R sebagai bahasa
pemrograman menjadi jauh lebih luas.

Secara umum terbagi dua jenis paket software untuk keperluan
analisis data, yaitu kelompok software komersil dan kelompok open source
software. Beberapa software komersil yang popular digunakan untuk
analisis data adalah SPSS, MINITAB, Eviews, SAS, dan Splus. Sedangkan
beberapa open source software yang digunakan sebagai alat bantu dalam
analisis data antara lain R, Open Stats, SalStat, Vista, dan lain‐lain.

R didesain sebagai alat bantu untuk pengolahan data dan
perkembangan serta kemampuannya mencakup hampir semua lini dalam
analisis data, tidak heran saat ini banyak analis data dan ilmuwan data
(data scientist) menggunakan R untuk menyelesaikan berbagai macam
permasalahan. Berikut ini merupakan kelebihan dari R.
 Gratis dan Open Source

Istilah open source (pada opensource.com) merujuk kepada sesuatu
yang bisa dimodifikasi dan dibagikan. Open Source Software (OSS)

1

sendiri berarti software yang source code-nya dapat diperiksa,
dimodifikasi, ditambahkan dan dibagikan oleh siapapun.
 Tersedia banyak package
R merupakan open source software sehingga hampir semua package
yang ada dapat digunakan secara bebas. Package adalah kumpulan
suatu script yang umumnya berupa function atau data yang dapat
digunakan untuk kebutuhan tertentu.
 Dibuat oleh statistisi untuk data analyst/data scientist
R merupakan sebuah program yang awalnya dibuat untuk kebutuhan
statistisi. Oleh karena itu, banyak fungsi-fungsi dasar untuk statistika
maupun eksplorasi data dan grafis sederhana sudah terdapat di R
meskipun tanpa install package tambahan. Namun saat ini R sudah
menjadi salah satu software yang digunakan dalam data science oleh
karena banyaknya package yang mendukung.
 Mudah dalam melakukan transformasi dan pemrosesan data
R digunakan sebagai alat bantu untuk analisis data, karena program R
memiliki kemampuan dalam transformasi data seperti penyiapan data,
import dan export data dalam berbagai format, dan lain-lain.
 Mampu menghasilkan grafik yang sangat bagus
Salah satu keunggulan yang dimiliki oleh R adalah menghasilkan grafik
yang sangat bagus. Salah satu yang diunggulkan adalah package
{ggplot2}, meskipun masih banyak package untuk visualisasi selain
{ggplot2}.
 Membuat Reproducible report
Ketika memiliki pekerjaan untuk membuat laporan secara rutin, maka
dapat menggunakan R sebagai robot. Dengan package {rmarkdown},
dapat membuat laporan rutin dengan hanya satu baris perintah.
 Dapat membuat aplikasi interaktif/dashboard berbasis web
Package {shiny} (dan semua pengembangannya) dan {flexdashboard}
dapat digunakan untuk membuat visualisasi interaktif ataupun sebagai
sebuah produk dari data science.

2

 Membuat REST API
Setelah membuat fungsi atau model prediktif dan ingin digunakan
secara lebih luas, Dapat membuatnya sebagai API menggunakan
package {plumber}.

Dan masih banyak lagi kemampuan R yang dapat dimanfaatkan untuk
mendukung dan memudahkan dalam melakukan analisis data.
1. 2. Instalasi R dan Memulai R

Untuk melakukan instalasi R Pada Windows dapat mengikuti
langkah-langkah berikut :
 Buka halaman https://cran.r-project.org
 Pilih Download R for Windows

Gambar 1. 1 Comprehensive R Archive Network (CRAN)
Bagi yang menggunakan selain windows, dapat mengikuti petunjuk dengan
membuka tautan yang sesuai.
 Klik R-4.2.2.pkg yang merupakan versi terbaru R untuk Windows

Gambar 1. 2 Download R Installer
 Simpan file installer tersebut dan tunggu hingga proses download selesai
 Setelah download selesai, jalankan file R-4.2.2.pkg tersebut
 Selanjutnya klik Continue dan Finish
Setelah selesai install, dapat membuka R GUI dengan cara sebagai berikut:

3

 Cari icon R yang sudah terinstall

Gambar 2. 1

Gambar 1. 3 Menu untuk Menjalankan R

Di bawah ini adalah tampilan ketika membuka program R GUI.

Gambar 1. 4 Tampilan R GUI
Jika bentuk tampilan seperti ini, artinya sudah dapat menggunakan R
melalui R GUI. Selain itu dapat menggunakan Integrated Development
Environment (IDE) untuk lebih nyaman, mudah dan efisien ketika bekerja
dengan R. IDE untuk R yang saat ini sangat sering digunakan adalah
RStudio.

4

1. 3. Instalasi R Studio dan Memulai R Studio
R Studio merupakan Integrated Development Environment (IDE)

untuk R yang banyak digunakan hingga saat ini. Dapat dikatakan bahwa
hampir semua pengguna R yang sudah mengetahui RStudio akan lebih
memilih menggunakan R melalui RStudio dibandingkan dengan
menggunakan R GUI.

Download R Studio versi desktop sesuai dengan kebutuhan.
Sangat disarankan untuk menggunakan R Studio versi terbaru, untuk dapat
menggunakan program R Studio terlebih dulu harus install R. Gambar 1.5
mengilustrasikan perumpamaan R ini seperti kerangka mobil dan
mesinnya, sedangkan R Studio seperti kerangka luar mobil dan interiornya.
Jika hanya menginstall R Studio saja maka tidak akan akan dapat
digunakan.

Gambar 1. 5 Perumpamaan R dan RStudio

(sumber: https://community.rstudio.com/t/differentiating-r-from-rstudio/8009)

Cara melakukan instalasi RStudio adalah sebagai berikut :
 Download RStudio Desktop dari situs

https://www.rstudio.com/products/rstudio/download/
 Jalankan installer yang sudah didownload, lalu klik dan geser icon

Rstudio ke dalam folder Application
 Tunggu prosesnya selesai. R Studio sudah terinstal.

5

Gambar 1. 6 Menu untuk menjalankan RStudio
1. 4. Penggunaan RStudio

Penggunaan bahasa R untuk keperluan apapun, baik itu untuk
programming, statistika hingga data science, terlebih dulu harus memahami
dan mengerti dalam menulis dan eksekusi skrip. Untuk memudahkan
proses tersebut, software IDE seperti R Studio banyak digunakan.

1.4.1 R Studio dan Fungsinya

Tool Bar Menu Bar

Script Windows Environment/ History

Console Files/ Plots/ Packages/
Help/ Viewer/
Presentation

Gambar 1. 7 Tampilan R Studio
R Studio memiliki empat jendela utama yaitu Script Window, Console
Window, Environment/ History Window, dan File/ Plots/ Packages/ Help/

6

Viewer Window . Selain itu, seperti perangkat lunak kebanyakan, Rstudio
juga memiliki Menu Bar dan Toolbar.
 Menu Bar. R Studio memiliki pilihan menu standar yang memberi akses

pengguna kepada fungsi – fungsi yang ada di dalamnya.
 Toolbar. Toolbar dalam R Studio sangat sederhana dengan tools yang

berfungsi untuk membuat dokumen baru, membuka dan menyimpan
dokumen, mencetak dokumen, fungsi Go to, pengaturan workspace dan
pengaturan Add ins. Toolbar dapat disembunyikan dan ditampilkan pada
Menu View.
 Script Window. Script Window merupakan jendela tempat script atau
kode ditulis. Jendela ini dapat diakses melalui tiga cara, yaitu melalui
Menu File > New File > R Script, melalui toolbar New dan
melalui shortcut CTRL+SHIFT+N.
 Console. Console menampilkan script yang telah dijalankan. Saat
cosole siap menerima perintah untuk menjalankan script
, tanda prompt “>” (tanda lebih dari) akan muncul. Saat script sedang
diproses, tanda merah seperti rambu berhenti akan muncul ( ). Tanda ini
dapat diklik untuk menghentikan proses yang sedang berjalan.
Console menampilkan apakah script berjalan dengan baik atau tidak,
serta menunjukkan kesalahan script melalui error code. Script dapat
langsung ditulis di Console. Namun hal ini tidak disarankan karena script
yang terdapat di Console tidak dapat disimpan.
 Environment/ History. Environment menunjukkan daftar “object” yang
tersedia beserta yang telah kita buat. Pada tab History, ditampilkan
rangkaian proses-proses yang telah dijalan secara urut.
 File/ Plots/ Packages/ Help/ Viewer/ Presentation. Jendela terakhir
berisi beberapa tab yaitu:
 File digunakan untuk navigasi folder yang terdapat pada

lokasi Home dari Rstudio.
 Plots menampilkan hasil plotting grafik atau gambar.
 Packages menunjukkan daftar packages yang dapat diinstal dan

digunakan dalam analisis mengunakan Rstudio.

7

 Help digunakan untuk mencari dan menampilkan bantuan untuk
memahami fungsi atau packages.

 Viewer berfungsi untuk melihat data frame dan data lain yang
berstruktur rektangular, dan juga preview untuk jenis-jenis file
lainnya.

1.4.2 Membuat dan menyimpan R skrip dokumen
Untuk membuat R dokumen baru, dapat menggunakan tiga cara.

Dengan langkah sebagai berikut:
 Melalui Menu

Untuk membuat dokumen R baru melalui menu, pilih menu File > New
File > R Script.

Gambar 1. 8 Membuat file kerja baru di R
 Melalui toolbar

Pilih toolbar New > R Script

Gambar 1. 9 Membuat Script Baru di RStudio

8

 Melalui shortcut
Untuk membuat dokumen R baru melalui shortcut, untuk pengguna
Windows cukup tekan CTRL+SHIFT+N secara bersamaan. Sementara
pengguna Mac cukup tekan SHIFT+COMMAND+N secara bersamaan.

Untuk menyimpan dokumen skrip, pilih Menu File lalu pilih Save atau Save
As. Lalu pilih lokasi file yang diinginkan.

Gambar 1. 10 Menyimpan File di RStudio

1.4.3 Menulis script di RStudio
Ada dua cara untuk menuliskan script atau kode R di RStudio,

dengan langkah sebagai berikut :
 Melalui Console Window

Pada console window dapat menulis skrip dengan mengetik kodenya,
lalu tekan Enter maka data akan tersimpan di Global Environment.
Tetapi tidak terekam sehingga tidak dapat mereplikasi hasil ketika R di
tutup. Metode ini tidak direkomendasikan jika akan menggunakan skrip
dilain waktu. Biasanya console digunakan untuk menulis kode yang
bersifat sementara atau sifatnya masih percobaan.

Gambar 1. 11 Menulis Script di Console

9

 Melalui script window
Pada script window dapat digunakan untuk menulis kode sebanyak
mungkin, dan dapat memilih skrip yang akan dijalankan. Selain itu juga
dapat menyimpan script sehingga dapat digunakan kembali. Dengan
langkah berikut :
 Ketik kode
 Blok atau letakkan kursor di baris kode yang diinginkan
 Klik Run atau tekan Ctrl+Enter
 Hasilnya keluar di Console.

Gambar 1. 12 Menulis Script di Windows Script

1.5 Latihan
1. Jelaskan kelebihan R dibanding dengan software analisis data
statistika lainnya !
2. Apakah perbedaan antara R dan RStudio? Jelaskan!

10

BAB 2
DASAR PEMROGRAMAN R STUDIO

Capaian Pembelajaran Mata Kuliah :
Memahami Dasar Pemrograman RStudio
Sub Capaian Pembelajaran Mata Kuliah :
1. Memahami operator penugasan pada RStudio
2. Memahami jenis data pada RStudio
3. Memahami fungsi dasar pada RStudio
4. Memahami package pada RStudio
5. Mampu membuat fungsi dasar pada RStudio secara mandiri

2.1. Assignment (Penugasan) dalam R
Bahasa pemrograman R mempunyai sedikit perbedaan dengan

bahasa pemrograman pada umumnya. Salah satunya adalah pada
operator assignment. Hampir semua bahasa pemrograman lain
menggunakan tanda = sebagai operator assignment. Di R, yang utama
dan paling banyak digunakan oleh pengguna R adalah operator panah
kiri <-. obj <- expr berarti “masukkan nilai hasil dari operasi di sisi kanan
(expr) ke dalam objek di sisi kiri (obj)”. Pada contoh berikut, akan
dimasukkan nilai numerik 6 ke objek yang disebut x.

Gambar 2. 2 Assigment <- dalam RStudio
Selain <-, operator = juga bisa digunakan sebagai operator assignment.

Gambar 2. 3 Assigment = dalam RStudio
Jika ingin mengetahui nilai suatu objek cukup panggil objek tersebut atau
gunakan fungsi print().

11

Gambar 2. 4 Fungsi print() dalam RStudio

2.2. Penamaan Objek
Aturan penamaan objek di R, seperti vector, matriks, dataframe

dan lain-lain, hampir sama dengan aturan penamaan pada bahasa
pemrograman lain. Namun ada beberapa aturan khusus yang terdapat di
R. Berikut aturan penamaan objek di R.
 Nama objek menggunakan kombinasi alfabet (a-z, A-Z), angka (0-9),

titik atau underscore.
 Nama objek diawali alfabet, titik atau underscore. Tidak boleh diawali

dengan angka.
 Nama objek tidak mengandung spasi, tab atau karakter khusus

seperti !, @, # dan lainnya.
 Sebaiknya tidak menggunakan beberapa penamaan atau nilai yang

sudah digunakan oleh R (function dan keyword lainnya).
Misalnya c, q, TRUE, FALSE, df, dt, rnorm, runif, rf, exp, dan lain-lain.
Untuk mengetahui nama-nama yang sudah digunakan oleh R kita
dapat mengetikkan perintah ?reserved di console RStudio.

2.3. Vector
Vector adalah objek data paling sederhana yang ada di dalam R.

Secara umum jenis vector terbagi 2, yaitu numeric dan character. Ada
banyak sekali cara untuk membuat sebuah vector di R, pada bagian ini
akan membahas beberapa cara yang banyak dan mungkin akan sering
digunakan.
 Fungsi c()

Fungsi yang paling sering digunakan untuk membuat sebuah vector
adalah dengan menggunakan fungsi c().

12

Gambar 2. 5 Membuat vector dengan fungsi c()
Pada script di atas, dibuat sebuah objek x berupa vector numeric.
Setiap elemen dipisah menggunakan tanda koma (,). Fungsi ini dapat
digunakan untuk membuat vector numeric atau character. Indeks di R
dimulai dari 1, tidak seperti kebanyakan bahasa pemrograman lain
yang indeksnya dimulai dari 0. Hal ini cukup memudahkan pengguna
karena umumnya manusia menghitung mulai dari 1, bukan dari 0.
Ketika ingin mengambil elemen ke 2 dari vector x, maka dapat
menjalankan perintah.

Gambar 2. 6 Memanggil elemen tertentu dari vector
 Tanda titik dua / colon (:)

Untuk membuat sebuah vector numeric berurutan secara meningkat
atau menurun. Lihat contoh berikut ini.

Gambar 2. 7 Membuat vector dengan tanda titik dua
Fungsi dari operator : pada contoh di atas adalah membuat vector
numeric dengan nilai dari 1 s/d 15. Tentu saja operator increment
(kenaikan) ini hanya dapat digunakan untuk numeric dan meningkat
sebesar 1 nilai. Operator ini dapat juga digunakan untuk membuat
vector dengan nilai menurun, x = 15 : 1.

13

 Fungsi seq()
Fungsi ini dapat digunakan untuk membuat vector berurutan dan
dengan increment (kenaikan) tertentu.

Gambar 2. 8 Membuat vector dengan funsi seq()
Secara default increment dari fungsi seq() adalah by=1. Jika Kita ingin
nilai increment lain maka hanya perlu mengganti nilai pada argumen
by. Fungsi ini juga hanya dapat digunakan untuk membuat vector
numeric.

Gambar 2. 9 Membuat vector dengan fungsi seq() dan argumen yang berbeda
 Fungsi rep()

Dengan fungsi rep() Kita dapat membuat sebuah vector dengan
mengulang-ulang nilai yang diinginkan sebanyak yang dibutuhkan.

Gambar 2. 10 Fungsi rep() dalam RStudio
 Vector character

Vector character adalah vector yang semua elemennya bertipe
character.

Gambar 2. 11 Vector dengan tipe data character

14

Jika ketika membuat sebuah vector bernilai numeric namun ada satu
saja elemennya bertipe character maka semua elemennya akan
bertipe character.
2.4. Factor

Factor merupakan bentuk lebih luas dari vector. Biasanya factor
lebih sering digunakan untuk menyimpan data nominal atau ordinal.
Misalnya vector character yang berisi "male" dan "female". Pada vector
character, nilainya adalah "male" dan "female" seperti terlihat apa
adanya. Namun pada factor, tampilan dari isi datanya mungkin "male" dan
"female" tetapi isi dari factor adalah pengkodean numerik. Misal
untuk "female" nilai sebenarnya adalah 1, sedangkan "male" bernilai 2.

Gambar 2. 12 Membuat factor dengan fungsi factor()
Nilai sebenarnya dari factor tersebut adalah

Gambar 2. 13 Mendefinisikan nilai factor
Factor mempunyai level, secara default levelnya adalah berdasarkan
urutan alfabet. Untuk merubah level dari sebuah factor, gunakan argumen
levels=

Gambar 2. 14 Mendefinisikan levels pada factor

15

2.5. Matriks
Matriks adalah objek di R yang memiliki 2 dimensi, baris (row) dan

kolom (column), dan tipe nilainya sama. Jika ketika membuat sebuah
matriks elemennya memiliki minimal 1 elemen bertipe character maka
seluruh matriks tersebut akan bertipe character. Membuat matriks di R
menggunakan vector yang dikonversi dimensinya.

Gambar 2. 15 Membuat matriks dari beberapa vector
Variabel x adalah data vector dengan jumlah 20 data. Akan diubah menjadi
bentuk matriks dengan ukuran 5 x 4 dengan menggunakan fungsi matrix().
data merupakan data vector yang akan diubah ke matriks, ncol merupakan
jumlah kolom, dan nrow merupakan jumlah baris. Argumen byrow = TRUE
artinya matriks akan setiap elemen x diisikan ke matriks memenuhi baris
terlebih dahulu. Jika byrow = FALSE maka setiap elemen x diisikan ke
matriks berdasarkan kolom terlebih dahulu.

Gambar 2. 16 Membuat matriks dengan argumen berbeda

16

Untuk membuat matriks dengan nilai yang sama seluruhnya, maka dapat
dilakukan seperti berikut.

Gambar 2. 17 Matriks dengan nilai yang sama
Untuk mengakses elemen dari suatu matriks, dapat menggunakan indeks
dari baris atau kolomnya.

Gambar 2. 18 Cara mengakses elemen matriks
R menyediakan sebuah fungsi yaitu diag() untuk mengakses nilai-nilai
pada diagonal utama sebuah matriks.

Gambar 2. 19 Cara mengakses diagonal matriks

17

2.6. Array
Array merupakan objek seperti matriks dengan dimensi lebih

banyak. Jika matriks hanya mempunyai 2 dimensi, maka array dapat
memiliki lebih dari 2 dimensi. Salah satu array yang sudah disediakan
oleh R adalah array Titanic.

Gambar 2. 20 Contoh array Titanic yang sudah ada pada RStudio
2.7. Data Frame

Data frame layaknya sebuah tabel di Ms Excel, terdiri dari baris
dan kolom dengan nama masing-masing kolom berbeda. Apa bedanya
dengan matriks? Matriks hanya bisa menyimpan tipe data yang sama,
numeric atau character seluruhnya. Pada dataframe, masing-masing
kolom boleh memiliki tipe data yang berbeda. Dataframe seperti
umumnya bentuk tabel yang sering digunakan. Contoh dataframe yang
ada di dalam R salah satunya adalah mtcars.

18

Gambar 2. 21 Data frame mtcars pada RStudio

Umumnya saat melakukan analisis data, sering menggunakan
data dalam bentuk tabel. Di dalam R sebuah tabel yang terdiri dari baris
dan kolom disebut dataframe atau data.frame. Baris di dataframe
disebut observation dan kolom disebut variable .

Untuk membuat sebuah dataframe dapat menggunakan
fungsi data.frame(). Misalnya akan membuat sebuah dataframe
bernama frame1 yang berisi 5 observation dan 2 variabel. Variabel
pertama bernama nama berisi sebuah vector string dengan nilai {"Ani",
"Ana","Ine","Ina","Eni"} dan variable kedua bernama tinggi berisi vector
character dengan nilai (155, 160, 151, 170, 165}. Terlbih dulu dapat
membuat vector nama dan tinggi terlebih dahulu menggunakan
fungsi c() (atau fungsi lain yang sesuai untuk membuat vector). Kemudian
membuat dataframe dari vector tersebut.

Gambar 2. 22 Membuat dataframe dari vector

19

Untuk mengetahui ukuran dimensi sebuah dataframe dapat
menggunakan fungsi dim()

Gambar 2. 23 Dimensi dari data frame
Hasil dari fungsi dim() untuk dataframe atau matrix adalah sebuah vector
dengan elemen pertama adalah banyaknya observation, sedangkan
elemen kedua adalah banyaknya variable. Pada contoh di atas berarti
dataframe data1 memiliki 5 observation dan 2 variable. Untuk mengetahui
struktur dari sebuah dataframe] dapat menggunakan
fungsi str() (structure). Dengan fungsi ini dapat memperoleh informasi
lebih lengkap dari sebuah dataframe seperti banyaknya observation dan
variable, nama-nama variable, tipe variable, dan beberapa nilai baris
pertama untuk masing-masing variable.

Gambar 2. 24 Structure data frame
2.8. List

Objek list pada dasarnya mirip seperti vector, hanya saja tipe
elemennya bisa berbeda. Jika pada vector numeric semua elemennya
harus berupa numerik. Pada vector character semuanya harus karakter.
Pada objek list elemennya dapat berupa vector, factor, matriks, array,
dataframe, bahkan list di dalam list atau objek lain seperti model prediktif
yang dibuat di R. Contoh membuat list dengan fungsi list().

20

Gambar 2. 25 Membuat list dengan fungsi list()

Gambar 2. 26 Ilustrasi Objek dalam R
2.9. Function dan Packages

Ada fungsi dan packages yang sudah tersedia di R dan dapat
langsung digunakan dalam pemrograman. Tetapi kita juga bisa membuat
fungsi dan packages sesuai kebutuhan.

21

2.9.2 Menggunakan fungsi yang sudah ada
Karena dibuat untuk memudahkan analisis data, R mempunyai

banyak fungsi yang tersedia untuk melakukan analisis statistik. Untuk
mendapatkan nilai rata-rata dari sebuah vector numeric. Dapat langsung
menggunakan fungsi mean(). Untuk mendapatkan nilai minimum atau
maksimum tersedia fungsi min() dan max(). Fungsi sd() dapat digunakan
untuk mendapatkan nilai standard deviasi atau fungsi var() untuk
mendapatkan nilai ragam (varians). Perhatikan contoh berikut ini.

Gambar 2. 27 Contoh fungsi yang sudah ada dalam RStudio
Jika ingin mencari nilai statistik lima serangkai (minimum, Q1, Q2 atau
median, Q3, maksimum), dapat menggunakan fungsi summary().

Gambar 2. 28 Fungsi summary() untuk mencari statistik 5 serangkai
Jika fungsi atau data yang akan Kita gunakan berasal dari sebuah package,
maka Kita dapat gunakan fungsi library(), require() atau klik beri
tanda checklist pada tab Packages seperti pada Gambar di bawah untuk

22

mengaktifkan package tersebut pada session yang sedang di gunakan.
Tentunya package tersebut harus sudah diinstall sebelumnya.

Gambar 2. 29 Tab packages pada RStudio
2.9.2 Install Packages

Package adalah sebuah kumpulan fungsi atau data yang dibuat
untuk memudahkan proses di R tanpa harus menuliskan ulang script yang
dibutuhkan. Saat ini package menjadi bagian yang sangat penting
bagi Data Analyst atau Data Scientist ketika menggunakan R. Karena
dengan package tambahan (yang belum ada ketika install R) pekerjaan
dalam mengolah data menjadi lebih efisien.

Untuk dapat menggunakan fungsi atau data dari sebuah package
tambahan maka perlu menginstall package terlebih dahulu. Salah satu
contohnya adalah package {ggplot2}. Package ini sangat berguna untuk
membuat visualisasi data di R.

Install package di R sangat mudah dengan fungsi
install.packages("namapackages") atau melalui menu Install di
tab Packages di RStudio. Yang perlu diperhatikan ketika akan install
package adalah koneksi internet, nama package dan repository-nya.
Koneksi internet yang baik sangat dibutuhkan ketika install package untuk
R mendownload file package tersebut. Selanjutnya nama package juga

23

harus sesuai dari penulisannya, termasuk huruf kapitalnya. Misalnya ingin
install package {ggplot2}, maka harus dituliskan dengan install.packages
("ggplot2"). Jika penulisannya tidak sama maka package tersebut tidak
akan diinstall. Perhatikan contoh berikut ini.

Gambar 2. 30 Proses instal packages di console
Hal yang perlu diperhatikan selanjutnya adalah repository package. Ada
beberapa repository yang digunakan sebagai tempat penyimpanan
package. Repository yang paling umum adalah Comprehensive R Archive
Network (CRAN). Ketika menggunakan fungsi install.packages() maka
secara otomatis package yang akan diinstall berasal dari CRAN.

2.10. Mencari Help Sebuah Fungsi
Keterangan sebuah fungsi dalam R tentang kegunaan sebuah

fungsi, argumen apa saja yang diperlukan, bagaimana penggunaannya
dan output yang dihasilkan dapat diketahui dengan menggunakan fungsi
help() atau mengetikkan ? di depan fungsi yang dimaksud.mSebagai
contoh, keterangan tentang fungsi mean(). Hal ini dapat diketahui dengan
mengetikkan ?mean atau help("mean"). Jika Kita menggunakan RStudio
maka akan muncul halaman help dari fungsi mean() di tab Help.

24

Gambar 2. 31 Hasil help fungsi ?mean
Umumnya pada sebuah halaman help akan ada informasi tentang
package asal fungsi, fungsi mean() berasal dari package {base}.
Kemudian deskripsi singkat tentang fungsi (Description), penggunaan
(Usage), penjelasan setiap argumen pada fungsi tersebut (Arguments),
penjelasan lebih detail (Value/Detail, jika ada) dan contoh penggunaan
fungsi (Examples, jika ada). Hal ini juga berlaku data yang ada di R, baik
itu dari package {base} ataupun package tambahan yang lain. Misalnya
halaman help dari data iris. Ketikkan ?iris pada console RStudio untuk
menampilkan halaman help data iris.

25

Gambar 2. 32 Hasil help data ?iris
2.11. Importing Dataset pada RStudio

Sebagai alat bantu untuk mengolah, analisis dan visualisasi data
sekaligus juga sebagai bahasa pemrograman tentunya R harus memiliki
kemampuan untuk mebaca data. Oleh karena itu, R dibekali kemampuan
membaca data atau import dari file eksternal. Pada bagian ini akan
dibahas cara import file excel, sas, spss, maupun stata.

26

Klik Import Dataset

Gambar 2. 33 Import Dataset ke R Studio
Setelah mengklik Import Dataset, maka akan muncul kotak dialog seperti
dibawah ini.

Gambar 2. 34 Memilih jenis sumber data yang akan diimport
Apabila sudah muncul kotak dialognya, langkah selanjutnya melakukan
pemilihan darimana data yang akan import. Sebagai contoh akan
melakukan import data excel.

27

Gambar 2. 35 Jendela file excel yang akan diimpor ke RStudio
Hasil import data excel ke dalam RStudio ditunjukkan pada gambar
berikut ini

library (readxl)
Latihan <- read_excel("C:/Users/Sisti Nadia Amalia/Downloads/Latihan.xlsx")
View(Latihan)

Gambar 2. 36 Hasil import file Latihan.xlsx ke dalam RStudio
Apabila data yang akan diimport tidak berada dalam directory project
yang sedang dikerjakan. Maka direktori file harus dituliskan juga dalam
argumen.
2.12 Latihan

Buatlah sebuah fungsi untuk menampilkan barisan Fibonacci

28

BAB 3
ANALISIS REGRESI SEDERHANA DENGAN R STUDIO

Capaian Pembelajaran Mata Kuliah :
1. Mampu Melakukan Analisis Regresi Linier Sederhana dengan R Studio

Sub Capaian Pembelajaran Mata Kuliah :
1. Mampu melakukan estimasi koefisien regresi sederhana dengan R Studio
2. Mampu melakukan uji asumsi klasik regresi sederhana dengan R Studio
3. Mampu melakukan uji kecocokan model regresi sederhana dengan R Studio
4. Mampu melakukan uji signifikansi parameter model regresi sederhana dengan

R Studio
5. Mampu melakukan interpretasi model terbaik.

3.1 Analisis Regresi Linear Sederhana

Analisis regresi secara konseptual merupakan metode sederhana

untuk memeriksa hubungan antara variabel (Chatterjee & Hadi, 1986).

Hubungan antara variabel yang dimaksudkan tersebut digambarkan dalam

bentuk persamaan atau model yang menghubungkan antara variabel

dependen ( y ) dan satu atau lebih variabel independen ( x ). Model regresi

dengan satu variabel independen dan linier dinyatakan sebagai:

yi  0  1xi   i (3.1)

yi : variabel terikat pada trial ke-i

xi : harga variabel bebas pada trial ke-i

0 ,1 : parameter-parameter yang dapat ditaksir dengan sampel.
i : galat.
Suatu model regresi yang linier dalam parameter dan linier dalam variabel
independen serta mempunyai satu variabel independen disebut: model

regresi linier sederhana.

3.2 Estimasi Parameter Regresi Linear Sederhana

Berdasarkan data sampel:  x1 , y1  ,  x2 , y2 , ...,  xn , yn , model

regresi untuk populasinya pada persamaan (4.1) dapat diestimasi oleh:

yˆ  ˆ0  ˆ1x (3.2)

Dengan metode kuadrat terkecil nilai ˆ 0 dan ˆ 1 dapat diestimasi oleh:

29

   ˆ0  x y
  y  x2  x xy , ˆ 1  n  xy  x2 (3.3)
 x2   x2
n n x2

Untuk mempermudah dalam melakukan estimasi parameter regresi linier

sederhana dapat menggunakan bantuan software R Studio, berikut adalah

langkah dan ilustrasinya .

Diketahui data mengenai nilai resiliansi siswa dan hasil belajar

siswa. Menurut Grotberg, resiliansi adalah kemampuan seseorang untuk

menilai, mengatasi, dan meningkatkan diri ataupun mengubah dirinya dari

keterpurukan atau kesengsaraan dalam hidup. Selain itu pendapat Reivich

dan Shatte mengenai resiliansi adalah kemampuan untuk bertahan,

beradaptasi terhadap sesuatu yang menekan, mampu mengatasi dan

melalui, serta mampu untuk pulih kembali dari keterpurukan. Dalam kasus

ini akan dilihat apakah ada pengaruh kemampuan resiliansi siswa terhadap

hasil belajarnya. Data disajikan sebagai berikut :

Tabel 3. 1 Contoh Data Regresi Sederhana

No. Resiliensi Siswa ( ) Hasil Belajar ( )
1 39 40
2 30 48
3 25 45
4 27 36
5 23 32
6 59 34
7 24 32
8 60 64
9 53 57
10 33 37
11 35 45
12 44 47
13 25 30
14 33 38
15 30 31
16 37 44
17 46 49
18 44 46
19 27 31
20 26 34

30

Estimasi parameter model regresi linear untuk menentukan hubungan

linear antara variabel bebas Resiliensi Siswa ( ) terhadap Hasil Belajar ( )

didapat menggunakan R Studio, hasilnya sebagai berikut :

Tabel 3. 2 Syntax Estimasi Parameter Regresi Linear Sederhana

#imporSt ydanttaax Estimasi Parameter Regresi Linear Sederhana
regresi_sederhana <- read_excel("C:/Users/Sisti Nadia Amalia/Downloads/regresi
sederhana.xlsx")
View(regresi_sederhana)
#install packages
install.packages('lmtest')
library(lmtest)
#syntax estimasi parameter regresi linear sederhana
model<-lm(Y~X,regresi_sederhana)
model

Tabel 3. 3 Output Estimasi Parameter Regresi Linear Sederhana

Call:
lm(formula = Y ~ X, data = regresi_sederhana)

Coefficients:

(Intercept) X

21.5402 0.5406

Berdasarkan tabel 3.3 di atas dapat dijelaskan bahwa model persamaan
regresi yang diperoleh yaitu:

̂ = 21,540 + 0,541
Tetapi model regresi diatas belum dapat dikatakan sebagai model regresi
terbaik. Untuk itu selain harus diidentifikasi terlebih dahulu apakah
memenuhi seluruh uji asumsi klasik.

3.3 Uji Asumsi Klasik Regresi Sederhana
Uji asumsi klasik merupakan persyaratan statistik yang harus

dipenuhi pada analisis regresi linear yang berbasis ordinary least square
(OLS). Uji asumsi klasik yang umunya dilakukan pada analisis regresi linier
sederhana yaitu : uji normalitas, uji heteroskedastisitas dan uji autokorelasi.
Pengujian asumsi tidak menggunakan dataset melainkan menggunakan
data residualnya. Hal ini yang harus dipahami mengenai konsep dari uji

31

asumsi klasik dan penggunaannya, sehingga dalam aplikasi statistik yang

digunakan akan menjadi tepat sasaran penggunaannya.

Pada persamaan regresi yi  0  1xi  i dengan regresi estimasi

ˆy  ˆ0  ˆ1x , residualnya adalah: (3.4)
eˆ i yi  yˆi

a. Uji Asumsi Heteroskedastisitas

Salah satu asumsi klasik adalah uji heteroskedastisitas yaitu

asumsi yang menyatakan bahwa varian setiap sisaan ( ) masih tetap sama
baik untuk nilai-nilai pada variabel independen yang kecil maupun besar.

Asumsi ini dapat ditulis sebagai berikut:

( ) = 2, = 1,2, … , (3.5)

untuk n menunjukkan jumlah observasi. Salah satu cara menguji kesamaan

variansi yaitu dengan melihat pola tebaran sisaan ( ) terhadap nilai
estimasi Y. Untuk menguji heteroskedastisitas suatu data dapat

menggunakan Uji Park. Beberapa solusi alternatif, jika model tersebut

melanggar asumsi heteroskedastisitas adalah mengubahnya menjadi

bentuk logaritmik. Ini hanya mungkin jika semua data positif. Atau semua

variabel dapat dibagi dengan variabel yang mengalami gangguan

heteroskedastisitas. Bentuk fungsi yang dianjurkan oleh Park adalah :

Ln (σi2) = Ln (σ2) + β* Ln( ) + ξ* (3.6)
Ln (e2) = α* + β* Ln( ) + ξ* (3.7)
Sehingga di dapat persamaan :

̂ * = α + β * + (3.8)

Perhitungan Transformasi data diperoleh sebagai berikut sebagai berikut :

Tabel 3. 4 Perhitungan Uji Park

ei ln(ei)2 x ln(x)
-2,621650 1,93 39 3,66
10,243310 4,65 30 3,40
9,946060 4,59 25 3,22
-4,00 27 3,30
-0,13504 1,36 23 3,14
-1,972830 5,93 59 4,08
-19,432680

32

-2,513390 1,84 24 3,18
10,026770 4,61 60 4,09
6,810630 3,84 53 3,97
-2,378350 1,73 33 3,50
4,540550 3,03 35 3,56
1,675590 1,03 44 3,78
-5,053940 3,24 25 3,22
-1,378350 0,64 33 3,50
-6,756690 3,82 30 3,40
2,459450 1,80 37 3,61
2,594490 1,91 46 3,83
0,675590 -0,78 44 3,78
-5,135040 3,27 27 3,30
-1,594490 0,93 26 3,26

Tabel 3. 5 Syntax Uji Heteroskedastisitas

#read data

lne<-regresi_sederhana$Lnei2
lne
lnx<-regresi_sederhana$Lnx
lnx
#syntax uji park
uji_park<-lm(lne~lnx)
summary(uji_park)

Tabel 3. 6 Output Uji Heteroskedastisitas

Call:
lm(formula = lne ~ lnx)

Residuals:
Min 1Q Median 3Q Max

-5.8010 -0.8244 0.0754 1.5051 2.9476

Coefficients: Error t value Pr(>|t|)
Estimate Std. 5.913 -0.782 0.444
1.665 1.170 0.257
(Intercept) -4.623
lnx 1.948

Maka diperoleh persamaan model regresi linear baru untuk Uji Park sebagai
berikut :

Ln(ei2) = - 4,623 – 1,948 Ln

33

Selanjutnya dilakukan pengujian koefisien regresi ini untuk mendeteksi ada
tidaknya pelanggaran asumsi homoskedastisitas.

Hipotesis Uji Heteroskedastisitas :
Ho : βi = 0 , tidak terdapat heteroskedastisitas pada data,
H1 : βi ≠ 0 , terdapat heteroskedastisitas pada data.
Kriteria pengujian:
Tolak Hipotesis Nol (H0) jika: t hitung > t tabel (α/2, n-2) atau – t hitung < t tabel
(α/2, n-2) atau nilai signifikansi < 0,05
Terima Hipotesis Nol (H0) jika: -t tabel (α/2, n-2) < t hitung < t tabel (α, n-2) atau nilai
signifikanasi > 0,05
Kesimpulan :
Dengan α = 5%, maka t tabel adalah t(0.025,18) = 2,445 Dari hasil perhitungan
statistik uji t student diperoleh nilai thitung sebesar 1,170 < ttabel sebesar 2,445
serta nilai signifikansi sebesar 0,257 > 0,05 yang berarti bahwa hipotesis
nol diterima sehingga dapat disimpulkan tidak terdapat pelanggaran asumsi
heteroskedastisitas.

b. Uji Asumsi Normalitas
Uji normalitas digunakan untuk melihat apakah nilai residu

terdistribusi normal atau tidak. Model regresi yang baik adalah memiliki
residu yang terdistribusi normal. Uji normalitas tidak dilakukan pada
variabel, tetapi pada nilai residual. Seringkali terjadi kesalahan yaitu uji
normalitas dilakukan pada variabelnya. Uji normalitas dapat dilakukan
secara grafis dengan uji normal P-Plot maupun dengan hipotesis uji
Kolmogorov-Smirnov.

Uji normal P-P plot, uji normalitasnya dapat dilihat dari penyebaran
data (titik) pada sumbu diagonal grafik atau normal dengan ~ (0, 2)
(Gujarati, 2004:109). Dasar pengambilan keputusannya, jika data
menyebar di sekitar garis diagonal dan mengikuti arah garis diagonal atau
grafik histogramnya menunjukkan pola distribusi normal, maka model
regresi memenuhi asumsi normalitas. Cara lain yaitu uji statistik salah
satunya dengan uji Kolmogorov-Smirnov. Uji Kolmogorov-Smirnov
didasarkan pada nilai D atau deviasi maksimum, yaitu:

34

= | 0( ) − ( )|, = 1, 2, … , (3.9)

dengan 0( ) adalah fungsi distribusi frekuensi kumulatif relatif dari

distribusi teoritis di bawah 0 . Kemudian ( ) adalah distribusi frekuensi

kumulatif pengamatan sebanyak sampel. Hipotesis nol adalah sisaan.

Hipotesis nol ( 0 ) adalah sisaan berdistribusi normal. Kriteria keputusan
uji Kolmogorov-Smirnov jika nilai < atau − pada output
lebih besar dari nilai taraf nyata maka asumsi normalitas dipenuhi.

Apabila uji normalitas tidak terpenuhi, beberapa langkah dapat

dilakukan yaitu melakukan transformasi data, memangkas outlier, atau

menambahkan data observasi. Transformasi dapat dalam bentuk logaritma

natural, akar kuadrat, inverses, atau bentuk lain, tergantung pada bentuk

normal kurva, apakah kiri, kanan, tengah, atau kanan dan kiri.

Metode Grafik

Gambar 3. 1 Grafik Deteksi Residual Berdistribusi Normal

Berdasarkan grafik 3.1 di atas terlihat bahwa titik-titik residu
menyebar mengikuti garis lurus. Ini menunjukkan bahwa sisaan menyebar
mengikuti sebaran normal. Untuk lebih memastikan digunakan hipotesis uji
Kolmogorov Smirnov.

Tabel 3. 7 Syntax Uji Normalitas
#install packages
install.packages('nortest')
library(nortest)
#syntax uji kolmogorov smirnov
lillie.test(error)

35

Tabel 3. 8 Output Uji Normalitas

Lilliefors (Kolmogorov-Smirnov)
normality test

data: error
D = 0.15083, p-value = 0.2728

Hipotesis Uji Normalitas :
H0 : F(x)  F0(x) { Residu berdistribusi normal }
H1 : F(x)  F0(x) { Residu tidak berdistribusi normal }
α : 5%
Kriteria Pengujian

Tolak H0 , jika nilai Pvalue ≤ 
Terima H0 , jika nilai Pvalue > 

Kesimpulan :
Berdasarkan output uji Kolmogorov Smirnov pada tabel 3.8, diperoleh
bahwa p-value residu model regresi linear ini sebesar 0,2728 > α=0,05.
Artimya bahwa hipotesis nol diterima sehingga dapat disimpulkan asumsi
residu mengikuti distribusi normal telah terpenuhi.

c. Uji Asumsi Autokorelasi
Salah satu asumsi penting dari regresi linear adalah bahwa tidak ada

autokorelasi antara serangkaian pengamatan yang diurutkan menurut
waktu. Adanya kebebasan antar sisaan dapat dideteksi secara grafis dan
empiris. Uji statistik yang sering dipergunakan adalah uji Durbin-Watson.

Tabel 3. 9 Syntax Uji Autokorelasi

#install packages
install.packages('car')
library(carData)
#syntax uji durbin watson
durbinWatsonTest(model))

Tabel 3. 10 Output Uji Autokorelasi

lag Autocorrelation D-W Statistic p-value
0.314
1 0.2122588 1.564901

Alternative hypothesis: rho != 0

36

Hipotesis Uji Autokorelasi :
H0 : ρ = 0, {tidak terdapat autokorelasi}
H1 : ρ ≠ 0, {terdapat autoorelasi}
α = 5%
Statistik uji Durbin Watson :
dH = ∑ (et – et-1) 2 / ∑ et 2 = 1,565
Kriteria uji :
Tolak H0 jika dH < dL atau dH > 4-dL
Terima H0 jika dU < dH < 4-dU
Kesimpulan :
Hasil perhitungan statistik Durbin Watson, ternyata, dH = 1,565 berada
dalam interval dL=1,20 dan 4-dU=2,59, maka H0 diterima, artinya dapat
disimpulkan bahwa dengan tingkat kepercayaan 95%, tidak terdapat
autokorelasi dalam residual model regresi linear tersebut.

3.4 Uji Kecocokan Model Regresi Sederhana
Berdasarkan uraian di atas sebelumnya bahwa semua pengujian

asumsi regresi linear telah terpenuhi semua baik residu normal,
homoskesdastisitas, tidak ada autokorelasi, sehingga model awal regresi
linear sederhana dapat diidentifikasi lebih lanjut.

Tabel 3. 11 Syntax Uji Kecocokan Model
#syntax uji
model<-lm(Y~X,regresi_sederhana)
model1<-lm(Y~factor(X),regresi_sederhana)
anova(model,model1)

Tabel 3. 12 Output Uji Kecocokan Model
Analysis of Variance Table

Model 1: Y ~ X
Model 2: Y ~ factor(X)
Res. Df RSS Df Sum of Sq F Pr(>F)
1 18 889.82
2 5 270.50 13 619.32 0.8806 0.61

Hipotesis Uji Kecocokan Model:

H0 : Model Cocok

H1 : Model Tidak Cocok

37

α = 5%
Statistik Uji
Fhitung = RKC/RGM=0,8806
Kriteria Uji
Tolak H0 , jika Fhitung > Ftabel atau nilai P-Value < 0,05
Terima H0, jika Fhitung < Ftabel atau nilai P-Value > 0,05
Kesimpulan :
Berdasarkan output diperoleh hasil perhitungan statistik uji Fhitung = 0,8806
< Ftabel=4,414 atau nilai P-Value=0,61 > α = 0,05, maka H0 diterima, artinya
dapat disimpulkan bahwa dengan tingkat kepercayaan 95%, model yang
cocok adalah model regresi linear.

3.5 Uji Signifikansi Parameter Model Regresi Sederhana

Tabel 3. 13 Syntax Model Terbaik Regresi Sederhana

#syntax resume model terbaik regresi berganda:

model<-lm(Y~X,regresi_sederhana)
summary(model)

Tabel 3. 14 Output Model Terbaik Regresi Sederhana

Call:
lm(formula = Y ~ X, data = regresi_sederhana)

Residuals:
Min 1Q Median 3Q Max

-19.4327 -2.5405 -0.7567 3.0810 10.2433

Coefficients:

Estimate Std. Error t value Pr(>|t|)
(Intercept) 21.5402 5.2626 4.093 0.000683 ***

X 0.5406 0.1395 3.875 0.001110 **
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 7.031 on 18 degrees of freedom

Multiple R-squared: 0.4548, Adjusted R-squared: 0.4245

F-statistic: 15.01 on 1 and 18 DF, p-value: 0.00111
Hipotesis Uji

Ho: β0 = β1 = 0 : Tidak terdapat pengaruh resiliensi siswa terhadap

hasil belajar.

38

H1: tidak semua βi ≠ 0 : Terdapat pengaruh resiliensi siswa terhadap hasil
belajar.

Kriteria uji :
Tolak H0 jika FHitung ≥ FTabel(1,18,5%), terima H0 dalam hal lain.
Kesimpulan :
Berdasarkan outuput, hasil perhitungan statistik Uji F diproleh FHitung
=15.013 > FTabel=4,41, maka H0 ditolak, artinya dapat disimpulkan bahwa
dengan tingkat kepercayaan 95%, terdapat pengaruh linear dari variabel
resiliansi siswa terhadap hasil belajar.

3.6 Interpretasi Model Terbaik Regresi Sederhana
Berdasarkan Tabel 3.13 di atas, secara umum model regresi linier

sederhana yang diperoleh telah memenuhi asumsi klasik regresi yaitu
asumsi normalitas, heteroskedastisitas dan autokorelasi melalui pengujian
hipotesis tidak terjadi pelanggaran terhadap ketiga asumsi tersebut.

Sehingga model regresi linear terbaiknya adalah sebagai berikut :
̂ = 21,5402 + 0,5406

Interpertasi Model Regresi Linear Sederhana di atas adalah sebagai
berikut:
 Intersep ( ̂ 0) dalam model di atas memberikan makna bahwa secara

rata-rata tingkat hasil belajar, dengan asumsi tingkat resiliansi siswa
dianggap konstan, maka akan meningkatkan sebesar 21,5402.
 Koefisien slope regresi variabel resiliansi siswa ( ̂ 1) dalam model di atas
memberikan gambaran bahwa setiap peningkatan resiliansi siswa
sebesar 1 satuan maka akan terjadi peningkatan hasil belajar sebesar
0,5406.

39

3.7 Latihan

Diberikan 10 data berpasangan ( , ) hasil observasi yang menunjukkan

tinggi ( ) dan berat ( ) orang dewasa.

X(cm) 150 162 160 162 165 160 172 170 180 182
Y(kg) 55 67 60 70 65 79 79 76 89 90

a) Tentukan Model Regresi

b) Uji asumsi klasiknya.

c) Uji kecocokan modelnya

d) Uji signifikansi parameter modelnya

e) Lakukan nterpretasi model terbaiknya

40

BAB 4
ANALISIS REGRESI BERGANDA DENGAN R STUDIO

Capaian Pembelajaran Mata Kuliah :
1. Mampu Melakukan Analisis Regresi Linier Berganda dengan R Studio

Sub Capaian Pembelajaran Mata Kuliah :
1. Mampu melakukan estimasi koefisien regresi berganda dengan R Studio
2. Mampu melakukan uji asumsi klasik regresi berganda dengan R Studio
3. Mampu melakukan uji kecocokan model regresi berganda dengan R Studio
4. Mampu melakukan uji signifikansi parameter model regresi berganda secara

simultan dengan R Studio
5. Mampu melakukan uji signifikansi parameter model regresi berganda secara

parsial dengan R Studio
6. Mampu melakukan interpretasi model terbaik.

4.1 Analisis Regresi Linier Berganda

Model regresi linear yang terdiri dari beberapa variabel independen

dan satu variabel dependen merupakan regresi linear berganda. Variabel

dependen dinotasikan dengan dan himpunan dari variabel independen

dinotasikan dengan 1, 2, … , dimana merupakan jumlah variabel
independen. Model regresi linear yang mengaitkan variabel respon

dengan himpunan > 1 variabel predictor ( 1, 2, … , ) disebut regresi
linear berganda. Model nya:

= 0 + 1 1 + 2 2 + ⋯ + + (4.1)

: variabel respons (variabel terikat) pada trial
: harga variabel xk bebas pada trial

: parameter-parameter yang dapat ditaksir dengan sampel.
: galat random, dengan asumsi ( ) = 0 dan ( ) = 2

4.2 Estimasi Parameter Regresi Berganda
Model regresi estimasi untuk persamaan (4.1) adalah:

̂ = ̂ 0 + ̂ 1 1 + ̂ 2 2 + ⋯ + ̂ (4.2)

Pembahasan model regresi linear berganda biasanya dilakukan dengan

menggunakan matriks. Model regresi linear berganda dengan dua prediktor

adalah:

= 0 + 1 1 + 2 2 + (4.3)

41

dan regresi estimasi untuk persamaan (4.3), dinyatakan dengan:

̂ = ̂ 0 + ̂ 1 1 + ̂ 2 2 (4.4)

Untuk mempermudah dalam melakukan estimasi parameter regresi linier

berganda dapat menggunakan bantuan software R Studio, berikut adalah

langkah dan ilustrasinya . Diketahui data mengenai plywood (kayu lapis),

kelembaban (moisture content) dan faktor ketebalan lem (glue line) sebagai

Sebagai informasi, plywood diperoleh dengan cara melekatkan beberapa

veneer secara berlapis-lapis dengan menggunakan lem khusus. Berikut

data disajikan :

No Plywood lem Veneer No Plywood lem Veneer
7.7
1 28.7 14.6 13.1 21 20.6 10 14.4
14
2 24.8 11.3 9.9 22 26.7 10.6 12.1
11.6
3 33.0 14.9 15.1 23 24.3 8.2 14.1
15
4 25.7 12 11.3 24 23.7 8.8 9.4
13.5
5 19.7 9.5 6.2 25 25.2 11.3 14.9
17.1
6 25.4 12.4 10.2 26 30.3 14.3 12.3
11.6
7 23.5 10 13.8 27 24.6 9.4 12.7
12.1
8 35.1 13.8 20.2 28 23.5 11.6 11
18.2
9 19.4 12.3 4.4 29 27.3 12.3

10 25.5 10.4 15 30 26.3 11.2

11 27.6 10.5 15.7 31 31.7 13.7

12 26.1 10.7 15.1 32 28.8 13.5

13 32.1 15.1 14.2 33 28.2 13.3

14 22.9 8.8 13.2 34 26.1 11.4

15 23.3 12.2 8.1 35 24.6 11.1

16 24 10.7 9.4 36 27.6 14.6

17 18 9.1 7.9 37 29.7 11.4

18 26.8 11.4 14.7

19 23 10.9 10.3

20 20.7 8.5 11.3

Tabel 4. 1 Contoh Data Regresi Berganda

Estimasi model regresi linear berganda untuk menentukan hubungan linear
antara variabel bebas kelembaban Venner ( 2) dan ketebalan Lem ( 1)
terhadap kelembaban Plywood ( ) menggunakan R Studio hasilnya
sebagai berikut :

42


Click to View FlipBook Version