The words you are searching are inside this book. To get more targeted content, please make full-text search by clicking here.
Discover the best professional documents and content resources in AnyFlip Document Base.
Search
Published by elivasukmacipta, 2021-06-27 18:17:28

KORELASI DAN REGRESI

E Modul Tugas ICT Revisi

Gambar 18 Residual Plots

Untuk menginterpretasikan plot residual, perlu menentukan apakah
residual membentuk suatu pola. Gambar 19 menunjukkan empat contoh plot
residual. Jika nilai residual kurang lebih terdistribusi secara merata di sekitar garis,
seperti yang ditunjukkan pada:

Gambar 19(a), maka hubungan antara x dan y bersifat linier dan garis regresi dapat
digunakan untuk membuat prediksi. Artinya standar deviasi masing-masing
variabel terikat harus sama untuk setiap nilai variabel bebas. Ini disebut asumsi
homoskedastisitas.

Gambar 19(b), menunjukkan bahwa varians dari residual meningkat dengan
meningkatnya nilai x. Ini berarti bahwa garis regresi tidak cocok untuk prediksi.

Gambar 19(c), menunjukkan hubungan lengkung antara nilai x dan nilai sisa;
karenanya, garis regresi tidak cocok untuk membuat prediksi.

Gambar 19(d), menunjukkan bahwa ketika nilai x meningkat, residu meningkat
dan menjadi lebih tersebar. Ini berarti bahwa garis regresi tidak cocok untuk
membuat prediksi.

48

Gambar 19 Contoh Plot Residu

Plot residual pada Gambar 18 menunjukkan bahwa garis regresi y' = 4,8 +
2,8x agak dipertanyakan untuk membuat prediksi karena ukuran sampel yang
kecil.

Koefisien Determinasi

Koefisien determinasi adalah rasio variasi yang dijelaskan terhadap variasi
total dan dilambangkan dengan 2. Artinya,

2 =


Sebagai contoh, 2 = 78,4/92,8 = 0,845. Istilah 2 biasanya dinyatakan
sebagai persentase. Jadi dalam hal ini, 84,5% dari total variasi dijelaskan oleh garis
regresi dengan menggunakan variabel bebas.

49

Cara lain untuk mendapatkan nilai 2 adalah dengan mengkuadratkan
koefisien korelasi. Dalam hal ini, r = 0,919 dan 2 = 0,845, yang merupakan nilai
yang sama ditemukan dengan menggunakan rasio variasi.

Koefisien determinasi adalah ukuran variasi variabel dependen yang dijelaskan
oleh garis regresi dan variabel independen. Simbol untuk koefisien determinasi
adalah 2.
__________________________________________________________________

Tentu saja, biasanya lebih mudah untuk menemukan koefisien determinasi
dengan mengkuadratkan r dan mengubahnya menjadi persentase. Oleh karena
itu, jika r = 0,90, maka 2 = 0,81, yang setara dengan 81%. Hasil ini berarti bahwa
81% variasi variabel dependen disebabkan oleh variasi variabel independen.
Variasi lainnya, 0,19, atau 19%, tidak dapat dijelaskan. Nilai ini disebut koefisien
nondeterminasi dan ditemukan dengan mengurangkan koefisien determinasi dari
1. Ketika nilai r mendekati 0, 2 menurun lebih cepat. Misalnya, jika r = 0,6, maka
2 =0,36, yang berarti bahwa hanya 36% variasi variabel dependen yang dapat
dikaitkan dengan variasi variabel independen.
Koefisien Nondeterminasi
1 - 2
Estimasi Standard Error

Ketika suatu nilai diprediksi untuk nilai x tertentu, prediksi tersebut adalah
prediksi titik. Namun, interval prediksi tentang nilai dapat dibangun, seperti
interval kepercayaan yang dibangun untuk perkiraan rata-rata populasi. Interval
prediksi menggunakan statistik yang disebut estimasi standard error.

50

__________________________________________________________________
Estimasi Standard Error, dilambangkan dengan , adalah standar deviasi dari
nilai y yang diamati terhadap nilai prediksi. Rumus untuk estimasi standar error
adalah

= √∑( − ′)2
− 2

Estimasi Standard Error mirip dengan simpangan baku, tetapi rata-rata tidak
digunakan. Seperti yang dapat dilihat dari rumus, Estimasi Standard Error adalah
akar kuadrat dari variasi yang tidak dapat dijelaskan—yaitu, variasi karena
perbedaan nilai yang diamati dan nilai yang diharapkan—dibagi dengan n - 2. Jadi
semakin dekat nilai-nilai yang diamati dengan nilai-nilai yang diprediksi, akan
semakin kecil Estimasi Standard Error.
Contoh 12 menunjukkan bagaimana menghitung Estimasi Standard Error.

Contoh 12
Biaya Pemeliharaan Mesin Fotokopi
Seorang peneliti mengumpulkan data berikut dan menentukan bahwa ada
hubungan yang signifikan antara usia mesin fotokopi dan biaya perawatan
bulanannya. Persamaan regresinya adalah y’ = 55,57 + 8,13x. Temukan estimasi
standard error.

51

Penyelesaian:
Langkah 1 Buat tabel, seperti yang ditunjukkan

Langkah 2 Dengan menggunakan persamaan garis regresi y' = 55,57 + 8,13x,
hitung nilai prediksi y' untuk setiap x dan tempatkan hasilnya di kolom
berlabel.

Langkah 3 Untuk setiap y, kurangi y' dan letakkan jawabannya di kolom berlabel
y - y'

52

Langkah 4 Kuadratkan angka-angka yang ditemukan pada langkah 3 dan
tempatkan kuadrat di kolom berlabel ( − ′)2.

Langkah 5 Temukan jumlah angka di kolom terakhir. Tabel yang sudah selesai
ditampilkan.

Langkah 6 Substitusi ke rumus dan cari

Dalam hal ini, standar deviasi dari nilai yang diamati tentang nilai prediksi adalah
6,51
estimasi standar error juga dapat ditemukan dengan menggunakan rumus

Contoh 13
Temukan estimasi standar error untuk data Contoh 12 dengan menggunakan
rumus sebelumnya. Persamaan garis regresinya adalah y' = 55,57 + 8,13x.

53

Penyelesaian:
Langkah 1 Buat tabel.
Langkah 2 Temukan produk dari nilai x dan y, dan letakkan hasilnya di kolom

ketiga.
Langkah 3 Kuadratkan nilai y, dan tempatkan hasilnya di kolom keempat.
Langkah 4 Temukan jumlah kolom kedua, ketiga, dan keempat. Tabel yang sudah

selesai ditampilkan di sini

Langkah 5 Dari persamaan regresi y' = 55,57 + 8,13x, a = 55,57, dan b = 8,13.
Langkah 6 Substitusikan ke dalam rumus dan selesaikan

Nilai ini mendekati nilai yang ditemukan pada Contoh 12. Perbedaannya adalah
karena pembulatan
Interval Prediksi
Estimasi standar error dapat digunakan untuk membangun interval prediksi (mirip
dengan interval kepercayaan) tentang nilai y'.

54

Ketika nilai spesifik x disubstitusikan ke dalam persamaan regresi, y' yang
Anda dapatkan adalah taksiran titik untuk y. Misalnya, jika persamaan garis regresi
untuk usia mesin dan biaya perawatan bulanan adalah y’ = 55,57 + 8,13x (Contoh
12), maka perkiraan biaya perawatan untuk mesin berusia 3 tahun adalah y = 55,57
8,13(3), atau $79,96. Karena ini adalah perkiraan titik, kita tidak tahu seberapa
akuratnya. Tetapi kita dapat membuat interval prediksi tentang estimasi tersebut.
Dengan memilih suatu nilai, kita dapat mencapai a (1 -α) x 100% keyakinan bahwa
interval tersebut berisi rata-rata aktual dari nilai y yang sesuai dengan nilai x yang
diberikan.

Alasannya adalah bahwa ada kemungkinan sumber kesalahan prediksi
dalam menemukan persamaan garis regresi. Satu sumber terjadi ketika
menemukan estimasi standar error . Dua lainnya adalah kesalahan yang dibuat
dalam memperkirakan kemiringan dan intersep y, karena persamaan garis regresi
akan sedikit berubah jika sampel acak yang berbeda digunakan saat menghitung
persamaan.

Rumus untuk Interval Prediksi untuk Nilai y’

Contoh 13
Untuk data pada Contoh 12, temukan interval prediksi 95% untuk biaya perawatan
bulanan mesin yang berumur 3 tahun.

55

Penyelesaian
Langkah 1 Cari ∑ , ∑ 2, ̅
Langkah 2 Temukan y' untuk x = 3
Langkah 3 Temukan .
seperti yang ditunjukkan pada Contoh 13.
Langkah 4 Substitusikan ke dalam rumus dan selesaikan: ⁄2= 2,776, d.f. = 6 - 2 =
4 untuk 95%.

Oleh karena itu, kita dapat yakin 95% bahwa interval 60,53 < y < 99,39 berisi nilai
sebenarnya dari y.

56

F. REGRESI GANDA

Bagian sebelumnya menjelaskan konsep regresi linier sederhana dan
korelasi. Dalam regresi linier sederhana, persamaan regresi mengandung satu
variabel bebas x dan satu variabel terikat y' dan ditulis sebagai:

di mana a adalah titik potong y' dan b adalah kemiringan garis regresi.
Dalam regresi berganda, terdapat beberapa variabel bebas dan satu
variabel terikat, dan persamaannya adalah

dimana x1, x2, . . . , xk adalah variabel bebas
Sebagai contoh, anggaplah seorang instruktur keperawatan ingin melihat
apakah ada hubungan antara nilai rata-rata, usia, dan skor ujian keperawatan. Dua
variabel bebas tersebut adalah IPK (dilambangkan dengan x1) dan usia
(dilambangkan dengan x2). Instruktur akan mengumpulkan data untuk ketiga
variabel untuk sampel mahasiswa keperawatan. Daripada melakukan dua studi
regresi sederhana yang terpisah, satu menggunakan IPK dan skor ujian
keperawatan dan lainnya menggunakan usia dan skor ujian keperawatan,
instruktur dapat melakukan satu studi menggunakan analisis regresi berganda
dengan dua variabel independen—IPK dan usia—dan satu variabel dependen—
skor ujian keperawatan.
Korelasi regresi berganda R juga dapat dihitung untuk menentukan apakah
ada hubungan yang signifikan antara variabel independen dan variabel dependen.
Analisis regresi berganda digunakan ketika seorang ahli statistik berpikir ada
beberapa variabel independen yang berkontribusi terhadap variasi variabel
dependen. Analisis ini kemudian dapat digunakan untuk meningkatkan akurasi
prediksi untuk variabel dependen atas satu variabel independen saja.
Dua contoh lain untuk analisis regresi berganda adalah ketika seorang
manajer toko ingin melihat apakah jumlah yang dihabiskan untuk iklan dan jumlah

57

ruang lantai yang digunakan untuk tampilan mempengaruhi jumlah penjualan
suatu produk, dan ketika seorang sosiolog ingin melihat apakah jumlah waktu yang
dihabiskan anak-anak untuk menonton televisi dan bermain video game
berhubungan dengan berat badan mereka. Analisis regresi berganda juga dapat
dilakukan dengan menggunakan lebih dari dua variabel bebas, dilambangkan
dengan x1, x2, x3, . . . , xm. Karena perhitungan ini cukup rumit dan sebagian besar
akan dilakukan di komputer, bab ini akan menunjukkan perhitungan untuk dua
variabel independen saja.

Misalnya, instruktur keperawatan ingin melihat apakah nilai rata-rata dan
usia siswa terkait dengan nilai siswa pada ujian keperawatan. Dia memilih lima
siswa dan memperoleh data berikut

Persamaan regresi berganda yang diperoleh dari data tersebut adalah

Jika seorang siswa memiliki IPK 3,0 dan berusia 25 tahun, skor ujian
keperawatan yang diprediksinya dapat dihitung dengan mengganti nilai-nilai ini
dalam persamaan untuk x1 dan x2, masing-masing, seperti yang ditunjukkan.

Oleh karena itu, jika seorang siswa memiliki IPK 3.0 dan berusia 25 tahun,
skor papan negara yang diprediksi siswa adalah 581

58

Persamaan Regresi Berganda
Persamaan regresi berganda dengan dua variabel bebas (x1 dan x2) dan

satu variabel terikat berbentuk

Persamaan regresi berganda dengan tiga variabel bebas (x1, x2, dan x3) dan
satu variabel terikat berbentuk

Bentuk Umum Persamaan Regresi Berganda
Bentuk umum persamaan regresi berganda dengan k variabel bebas adalah

X adalah variabel bebas. Nilai untuk a kurang lebih merupakan intersep,
meskipun persamaan regresi berganda dengan dua variabel bebas lebih
merupakan bidang daripada garis. b disebut koefisien regresi parsial. Setiap b
mewakili jumlah perubahan y' untuk satu unit perubahan nilai x yang sesuai ketika
nilai x lainnya tetap konstan. Dalam contoh yang baru saja ditunjukkan, persamaan
regresinya adalah y' = 44,81 + 87,64x1 + 14,533x2. Dalam hal ini, untuk setiap
satuan perubahan IPK siswa terdapat perubahan 87,64 satuan nilai ujian
keperawatan dengan umur x2 siswa tetap. Dan untuk setiap satuan perubahan x2
(umur siswa), terdapat perubahan 14,533 satuan pada nilai ujian keperawatan
dengan IPK tetap.
Asumsi untuk Regresi Berganda
Asumsi untuk regresi berganda mirip dengan asumsi untuk regresi sederhana.
1. Untuk setiap nilai spesifik dari variabel independen, nilai variabel y

terdistribusi normal. (Ini disebut asumsi normalitas).

59

Asumsi untuk Regresi Berganda
2. Varians (atau standar deviasi) untuk variabel y adalah sama untuk setiap

nilai variabel independen. (Ini disebut asumsi varians yang sama)
3. Terdapat hubungan linier antara variabel terikat dengan variabel bebas.

(Ini disebut asumsi linearitas.)
4. Variabel bebas tidak berkorelasi. (Ini disebut asumsi nonmultikolinearitas.)
5. Nilai untuk variabel y adalah independen. (Ini disebut asumsi

independensi.)

Dalam regresi berganda, seperti pada regresi sederhana, kekuatan
hubungan antara variabel bebas dan variabel terikat diukur dengan koefisien
korelasi. Koefisien korelasi berganda ini dilambangkan dengan R. Nilai R dapat
berkisar dari 0 sampai +1; R tidak pernah bisa negatif. Semakin dekat ke +1,
semakin kuat hubungannya; semakin mendekati 0, semakin lemah hubungan
tersebut. Nilai R memperhitungkan semua variabel independen dan dapat
dihitung dengan menggunakan nilai koefisien korelasi individu. Rumus untuk
koefisien korelasi berganda ketika ada dua variabel bebas ditunjukkan berikut ini.
Rumus Koefisien Korelasi Berganda
Rumus untuk R adalah

dimana ryx1 adalah nilai koefisien korelasi untuk variabel y dan x1; ryx2 adalah nilai
koefisien korelasi untuk variabel y dan x2; dan rx1x2 merupakan nilai koefisien
korelasi untuk variabel x1 dan x2.

Dalam hal ini, R adalah 0,989, seperti yang ditunjukkan pada Contoh 15.
Koefisien korelasi ganda selalu lebih tinggi daripada koefisien korelasi individual.
Untuk contoh khusus ini, koefisien korelasi ganda lebih tinggi daripada dua

60

koefisien korelasi individu yang dihitung dengan menggunakan nilai rata-rata poin
dan skor ujian keperawatan (ryx1 = 0.845) atau skor usia dan skor ujian
keperawatan (ryx2 = 0.791). Catatan: rx1x2 = 0,371.

Contoh 15
Skor Ujian Keperawatan
Untuk data mengenai skor ujian keperawatan, carilah nilai R.
Penyelesaian:
Nilai koefisien korelasi adalah

Substitusi ke dalam rumus, didapat:

Oleh karena itu, korelasi antara IPK dan usia siswa dengan nilai siswa pada ujian
keperawatan adalah 0,989. Dalam hal ini, terdapat hubungan yang kuat antar
variabel; nilai R mendekati 1,00.
Seperti halnya regresi sederhana, R2 adalah koefisien determinasi berganda, dan
merupakan jumlah variasi yang dijelaskan oleh model regresi. Ekspresi 1 - R2
mewakili jumlah variasi yang tidak dapat dijelaskan, yang disebut kesalahan atau
variasi residual. Yaitu R = 0,989, R2 = 0,978 dan 1 - R2 = 1 - 0,978 = 0,022.

61

Menguji Signifikansi R
Uji F digunakan untuk menguji signifikansi R. Hipotesisnya adalah:

di mana ρ mewakili koefisien korelasi populasi untuk korelasi ganda
Uji F untuk Signifikansi R
Rumus untuk uji F adalah

n adalah jumlah kelompok data (x1, x2, . . . , y) dan k adalah jumlah variabel bebas.
Derajat kebebasannya adalah d.f.N. = n - k dan d.f.D. = n – k - 1.

Contoh 16
Skor Ujian Keperawatan
Uji signifikansi R yang diperoleh pada Contoh 15 pada α = 0,05.
Penyelesaian:

Nilai kritis diperoleh dari Tabel H dengan α = 0,05, d.f.N. = 3, dan d.f.D. = 5 - 2 - 1
= 2 adalah 19,16. Oleh karena itu, keputusannya adalah menolak hipotesis nol dan
menyimpulkan bahwa ada hubungan yang signifikan antara IPK, usia, dan skor
ujian keperawatan.

62

Adjusted R2
Karena nilai R2 bergantung pada n (jumlah pasangan data) dan k (jumlah variabel),
ahli statistik juga menghitung apa yang disebut R2 yang disesuaikan, dilambangkan
dengan . Ini didasarkan pada jumlah derajat kebebasan.
Rumus untuk R2 yang Disesuaikan

Adjusted R2 lebih kecil dari R2 dan memperhitungkan fakta bahwa ketika n dan k
kira-kira sama, nilai R mungkin tinggi secara artifisial, karena kesalahan
pengambilan sampel daripada hubungan yang sebenarnya antara variabel. Hal ini
terjadi karena variasi peluang dari semua variabel digunakan bersama-sama untuk
menurunkan persamaan regresi. Bahkan jika koefisien korelasi individu untuk
setiap variabel independen dan variabel dependen semuanya nol, koefisien
korelasi ganda karena kesalahan pengambilan sampel bisa lebih tinggi dari nol.
Oleh karena itu, baik R2 dan R2adj biasanya dilaporkan dalam analisis regresi
berganda.

Contoh 17
Skor Ujian Keperawatan
Hitung R2 yang disesuaikan untuk data dalam Contoh 16. Nilai untuk R adalah
0,989.

63

Penyelesaian:

Dalam hal ini, ketika jumlah pasangan data dan jumlah variabel bebas
diperhitungkan, koefisien determinasi berganda yang disesuaikan adalah 0,956.

G. RANGKUMAN
• Banyak hubungan antar variabel yang ada di dunia nyata. Salah satu cara

untuk menentukan apakah ada hubungan linier adalah dengan menggunakan
teknik statistik yang dikenal sebagai korelasi dan regresi. Kekuatan dan arah
hubungan linier diukur dengan nilai koefisien korelasi. Itu dapat
mengasumsikan nilai antara dan termasuk +1 dan -1. Semakin dekat nilai
koefisien korelasi dengan +1 atau -1, semakin kuat hubungan linier antar
variabel. Nilai +1 atau -1 menunjukkan hubungan linier yang sempurna.
Hubungan positif antara dua variabel berarti bahwa untuk nilai variabel bebas
yang kecil, nilai variabel terikat akan kecil, dan untuk nilai variabel bebas yang
besar, nilai variabel terikat akan besar. Hubungan negatif antara dua variabel
berarti bahwa untuk nilai variabel bebas yang kecil, nilai variabel terikat akan
besar, dan untuk nilai variabel bebas yang besar, nilai variabel terikat akan
kecil.
• Ingatlah bahwa hubungan yang signifikan antara dua variabel tidak selalu
berarti bahwa satu variabel merupakan penyebab langsung dari variabel
lainnya. Dalam beberapa kasus ini benar, tetapi kemungkinan lain yang harus
dipertimbangkan termasuk hubungan kompleks yang melibatkan variabel lain

64

(mungkin tidak diketahui), variabel ketiga yang berinteraksi dengan kedua
variabel, atau hubungan yang semata-mata karena kebetulan.
• Hubungan bisa linier atau lengkung. Untuk menentukan bentuknya, Anda
menggambar plot pencar dari variabel. Jika hubungannya linier, data dapat
didekati dengan garis lurus, yang disebut garis regresi, atau garis yang paling
sesuai. Semakin dekat nilai r dengan +1 atau -1, semakin dekat titik-titik yang
sesuai dengan garis.
• Plot residual dapat digunakan untuk menentukan apakah persamaan garis
regresi dapat digunakan untuk prediksi.
• Koefisien determinasi merupakan indikator kekuatan hubungan linier yang
lebih baik daripada koefisien korelasi. Lebih baik karena mengidentifikasi
persentase variasi variabel dependen yang secara langsung dikaitkan dengan
variasi variabel independen. Koefisien determinasi diperoleh dengan
mengkuadratkan koefisien korelasi dan mengubah hasilnya menjadi
persentase.
• Statistik lain yang digunakan dalam korelasi dan regresi adalah kesalahan
standar estimasi, yang merupakan estimasi standar deviasi nilai y terhadap
nilai y yang diprediksi. Kesalahan standar estimasi dapat digunakan untuk
membangun interval prediksi tentang estimasi titik nilai tertentu y dari rata-
rata nilai y untuk nilai x yang diberikan.
• Selain itu, hubungan bisa berlipat ganda. Artinya, bisa ada dua atau lebih
variabel bebas dan satu variabel terikat. Koefisien korelasi dan persamaan
regresi dapat ditemukan untuk beberapa hubungan, sama seperti mereka
dapat ditemukan untuk hubungan sederhana

65

H. LATIHAN
Lakukan analisis regresi lengkap dengan melakukan langkah-langkah berikut.
a. Gambarkan plot pencar.
b. Hitung nilai koefisien korelasi.
c. Uji signifikansi koefisien korelasi pada α = 0,01, menggunakan Tabel.
d. Tentukan persamaan garis regresi.
e. Plot garis regresi pada scatter plot.
f. Prediksi y untuk nilai x tertentu.

1. Tarif Penumpang dan Maskapai Penerbangan. Kantor Analisis Penerbangan
Departemen Transportasi AS memberikan jumlah rata-rata mingguan
penumpang per penerbangan dan tarif satu arah rata-rata dalam dolar untuk
rute komersial umum. Penerbangan yang dipilih secara acak tercantum di
bawah ini dengan data yang dilaporkan. Apakah ada bukti hubungan antara
kedua variabel ini?

2. Sekolah Dasar dan Menengah. Informasi distrik sekolah diperiksa untuk
pemilihan negara bagian secara acak. Data di bawah ini menunjukkan jumlah
sekolah dasar dan jumlah sekolah menengah untuk setiap negara bagian
tertentu. Apakah ada hubungan yang signifikan antara variabel? Prediksi
jumlah sekolah menengah ketika jumlah sekolah dasar adalah 300

66

3. Touchdown dan Peringkat QB. Tercantum di bawah ini adalah jumlah operan
touchdown yang dilemparkan pada musim ini dan peringkat quarterback
untuk sampel acak quarterback NFL. Apakah ada hubungan linier yang
signifikan antara variabel?

4. Usia Pengemudi dan Kecelakaan. Sebuah penelitian dilakukan untuk
mengetahui hubungan antara usia pengemudi dan jumlah kecelakaan yang
dialaminya selama periode 1 tahun. Data ditampilkan di sini. (Informasi ini
akan digunakan untuk Latihan 8.) Jika ada hubungan yang signifikan,
perkirakan jumlah kecelakaan seorang pengemudi yang 28.

5. Kecepatan Mengetik dan Pemrosesan Kata. Seorang peneliti ingin
mengetahui apakah kecepatan mengetik sekretaris (dalam kata per menit)
berhubungan dengan waktu (dalam jam) yang dibutuhkan sekretaris untuk
belajar menggunakan program pengolah kata baru. Data ditampilkan.

Jika terdapat hubungan yang signifikan, perkirakan waktu yang dibutuhkan
rata-rata sekretaris yang memiliki kecepatan mengetik 72 kata per menit
untuk mempelajari program pengolah kata. (Informasi ini akan digunakan
untuk Latihan 9 dan 11.)
6. Protein dan Tekanan Darah Diastolik. Sebuah penelitian dilakukan dengan
vegetarian untuk melihat apakah jumlah gram protein setiap makan per hari
terkait dengan tekanan darah diastolik. Data diberikan di sini. (Informasi ini

67

akan digunakan untuk Latihan 10 dan 12.) Jika ada hubungan yang signifikan,
prediksi tekanan diastolik seorang vegetarian yang mengonsumsi 8 gram
protein per hari

7. Spesialisasi Medis dan Gender. Meskipun semakin banyak wanita menjadi
dokter setiap tahun, diketahui bahwa jumlah pria melebihi wanita dalam
banyak spesialisasi. Spesialisasi yang dipilih secara acak tercantum di bawah
ini dengan jumlah dokter pria dan wanita di masing-masing. Dapatkah
disimpulkan bahwa terdapat hubungan yang signifikan antara kedua variabel
tersebut? Prediksi jumlah dokter spesialis pria bila ada 2000 dokter spesialis
Wanita

8. Untuk Latihan 4, temukan perkiraan standard error nya
9. Untuk Latihan 5, temukan perkiraan standard error nya
10. Untuk Latihan 6, temukan perkiraan standard error nya.
11. Untuk Latihan 5, temukan interval prediksi 90% untuk waktu ketika

kecepatannya adalah 72 kata per menit.
12. Untuk Latihan 6, temukan interval prediksi 95% untuk tekanan ketika jumlah

gram adalah 8
13. Sebuah studi menemukan hubungan yang signifikan antara tahun

pengalaman seseorang pada pekerjaan tertentu x1, jumlah hari kerja yang
terlewatkan per bulan x2, dan usia orang tersebut y. Persamaan regresinya
adalah y’ = 12.8 + 2.09x1 + 0.423x2. Memprediksi usia seseorang jika dia telah
bekerja selama 4 tahun dan telah melewatkan 2 hari kerja dalam sebulan

68

14. Temukan R ketika ryx1 = 0,681 dan ryx2 = 0,872 dan rx1x2 = 0,746
15. Cari R2adj ketika R = 0,873, n = 10, dan k = 3.
16. Dari Bank Data, pilih dua variabel yang mungkin terkait: misalnya, IQ dan

tingkat pendidikan; usia dan kadar kolesterol; olahraga dan berat badan; atau
berat badan dan tekanan sistolik. Lakukan analisis korelasi dan regresi lengkap
dengan melakukan langkah-langkah berikut. Pilih sampel acak minimal 10
subjek

a. Menggambar plot pencar.
b. Hitung koefisien korelasi
c. Uji hipotesis H0: r = 0.
d. Temukan persamaan garis regresi.
e. Ringkaslah hasilnya.

69

DAFTAR PUSTAKA
Bluman, Allan G. (2012). Elementary Statistics a Step by Step Approach. New York:

McGraw-Hill
Trihendradi, C. (2009). Step by Step SPSS Analisis Data Statistik. Yogjakarta: Andi.

70


Click to View FlipBook Version