PEDOMAN DASAR MENGOLAH DATA DENGAN PROGRAM APLIKASI STATISTIKA STATCAL (Disertai Perbandingan Hasil dengan SPSS & Minitab) Prana Ugiana Gio (CEO STATCAL) Rezzy Eko Caraka (CFO STATCAL) Belajar Secara Online di Youtube dengan Channel “Ugi Statistics” Download STATCAL di: www.statcal.com www.rezzyekocaraka.com ISBN: 978-602-465-061-2
Dari 40 Start Up yg mengikuti kegiatan Youth Economic Leadership Program-Bank Indonesia Institute (YELP-BINS) pada 27-31 Juli 2018, STATCAL masuk ke dalam 5 terbaik
Presentasi STATCAL pada 31 Juli 2018 di Techno Park, Cimahi, di depan para investor
Presentasi STATCAL pada kegiatan YELP-BINS 27-31 Juli 2018
KATA PENGANTAR Alhamdulillah, puji syukur atas kehadirat Allah SWT, karena atas izin-Nya, penulis dapat terus mempertahankan semangat untuk menulis, dan akhirnya dapat menyelesaikan tulisan ini. Hadirnya tulisan ini, tidak semata-mata atas usaha penulis sendiri, melainkan atas izin-Nya. Sungguh suatu kebahagiaan bagi penulis bisa berbagi sebagian kecil ilmu pengetahuan milik-Nya melalui tulisan yang berjudul “Pedoman Dasar Mengolah Data dengan Program Aplikasi Statistika STATCAL”. Ucapan terima kasih penulis sampaikan kepada semua pihak yang telah membantu dalam rangka penyelesaian tulisan ini. Penulis menyadari bahwa tulisan ini tentunya masih perlu perbaikan, sehingga penulis mengharapkan kritik dan saran yang membangun dari para pembaca agar tulisan ini dapat menjadi lebih baik. Kritik dan saran dapat ditujukan ke alamat email [email protected]. Medan, 27 Juni 2018 Prana Ugiana Gio Rezzy Eko Caraka
viii DAFTAR ISI Bab 1 STATCAL................................................................................................................................ [1] 1.1Sekilas STATCAL......................................................................................................................... [1] 1.2 Beberapa Program Aplikasi Statistika Commercial dan Gratis ............................................. [6] Bab 2 MENGINPUT DATA DI STATCAL................................................................................... [10] 2.1 Persiapan Data............................................................................................................................ [10] 2.2 Menginput Data Kategori di STATCAL.................................................................................. [11] 2.3 Menginput Data Numerik di STATCAL ................................................................................. [14] 2.4 Data Kosong (Not Available / NA) ........................................................................................... [16] Bab 3 DESKRIPTIF......................................................................................................................... [19] 3.1 Distribusi Frekuensi Univariat ................................................................................................. [19] 3.2 Distribusi Frekuensi Bivariat.................................................................................................... [21] 3.3 Berbagai Ukuran Deskriptif (Rata-Rata, Standar Deviasi, dan Sebagainya) ..................... [24] Bab 4 UJI ASUMSI NORMALITAS POPULASI ........................................................................ [29] Bab 5 UJI ASUMSI KESAMAAN VARIANS POPULASI ......................................................... [33] Bab 6 UJI BEDA DUA SAMPEL BERPASANGAN.................................................................... [38] 6.1 Contoh Kasus Uji Beda 2 Sampel Berpasangan...................................................................... [38] 6.2 Beberapa Kutipan Isi Buku Mengenai Uji Beda 2 Sampel Berpasangan (Uji t 2 Sampel Berpasangan dan Uji Wilcoxon) ....................................................................................... [41] 6.3 Uji t 2 Sampel Berpasangan dan Uji Wilcoxon ...................................................................... [42] 6.4 Contoh Kasus (Penyelesaian dengan SPSS) ............................................................................ [42] 6.5 Contoh Kasus (Penyelesaian dengan STATCAL) .................................................................. [50] 6.6 Contoh Kasus (Penyelesaian dengan Minitab) ....................................................................... [55] Bab 7 UJI T 2 SAMPEL INDEPENDEN & UJI MANN-WHITNEY......................................... [57] 7.1 Contoh Kasus Uji Beda 2 Sampel Independen........................................................................ [57] 7.2 Beberapa Kutipan Isi Buku Mengenai Uji t 2 Sampel Independen dan Uji MannWhitney ............................................................................................................................................. [60] 7.3 Uji t 2 Sampel Independen dan Uji Mann-Whitney ............................................................... [61] 7.4 Contoh Kasus (Penyelesaian dengan SPSS) ............................................................................ [62] 7.5 Contoh Kasus (Penyelesaian dengan STATCAL) .................................................................. [68] 7.6 Contoh Kasus (Penyelesaian dengan Minitab) ....................................................................... [75] Bab 8 KORELASI LINEAR PEARSON & SPEARMAN ........................................................... [78] 8.1 Sekilas Pengertian Korelasi Linear Pearson Berdasarkan Beberapa Buku......................... [78] 8.2 Korelasi Linear Pearson ............................................................................................................ [79] 8.3 Contoh Kurva Linear dan Nonlinear ....................................................................................... [81] 8.4 Contoh Sebaran Data Linear Sempurna dan Cenderung Linear.......................................... [83] 8.5 Sebaran Data dari Dua Variabel (Sebaran Data Cenderung Naik/Positif; Turun/Negatif; Linear Positif Sempurna; Linear Negatif Sempurna) ....................................... [84] 8.6 Mengukur Keeratan Hubungan Linear antara Dua Variabel dengan Korelasi Linear Pearson.............................................................................................................................................. [86] 8.7 Ukuran Pengaruh (Size of an Effect) ....................................................................................... [88] 8.8 Kapan Uji Asumsi Normalitas Perlu Diuji? Apa Akibatnya Jika Asumsi Normalitas Tidak Dipenuhi? Pada Kondisi Bagaimana Uji Asumsi Normalitas Dapat Diabaikan? Menggunakan Pendekatan Apakah Untuk Menguji Keakuratannya? ..................................... [89] 8.9 Korelasi Linear Pearson Digunakan untuk Pengujian Validitas........................................... [91]
ix 8.10 Ketika Akan Melakukan Uji Signifikansi Koefisien Korelasi Pearson, Kapan Uji Asumsi Normalitas Harus Diuji? Adakah Metode Alternatif Selain dari Korelasi Linear Pearson, ketika Asumsi Normalitas Tidak Dipenuhi? ................................................................. [93] 8.11 Contoh Kasus Korelasi Linear Pearson dengan STATCAL................................................ [93] 8.12 Contoh Kasus Korelasi Linear Pearson dengan STATCAL (Uji Validitas) ...................... [99] 8.13 Contoh Kasus Korelasi Linear Pearson dengan STATCAL, SPSS dan Minitab............. [101] Bab 9 ANALISIS VARIANS & UJI KRUSKAL-WALLIS ....................................................... [113] 9.1 Contoh Data dan Contoh Kasus dari Analisis Varians dan Uji Kruskal-Wallis................ [113] 9.2 Beberapa Kutipan Isi Buku Mengenai Analisis Varians dan Uji Kruskal-Wallis............. [115] 9.3 Analisis Varians dan Uji Kruskal-Wallis............................................................................... [120] 9.4 Asumsi Normalitas dan Kesamaan Varians pada Analisis Varians.................................... [121] 9.5 Uji Perbandingan Berganda (Multiple Comparison Test) .................................................. [122] 9.6 Contoh Kasus Penyelesaian dengan SPSS (Analisis Varians) ............................................. [123] 9.7 Contoh Kasus Penyelesaian dengan SPSS (Uji Kruskal-Wallis) ........................................ [131] 9.8 Contoh Kasus Penyelesaian dengan STATCAL (Analisis Varians) ................................... [136] 9.9 Contoh Kasus Penyelesaian dengan STATCAL (Uji Kruskal-Wallis) .............................. [143] Bab 10 REPEATED-MEASURES ANOVA & UJI FRIEDMAN ............................................. [148] 10.1 Contoh Data dan Contoh Kasus Repeated-Measures ANOVA & Uji Friedman............. [148] 10.2 Beberapa Kutipan Isi Buku Mengenai Repeated-Measures ANOVA dan Uji Friedman......................................................................................................................................... [149] 10.3 Repeated-Measures ANOVA dan Uji Friedman................................................................. [152] 10.4 Asumsi Normalitas dan Kesamaan Varians (Sphericity) pada Repeated-Measures ANOVA ........................................................................................................................................... [153] 10.5 Contoh Kasus Penyelesaian dengan SPSS (Repeated-Measures ANOVA) ..................... [153] 10.6 Contoh Kasus Penyelesaian dengan SPSS (Uji Friedman) ................................................ [163] 10.7 Contoh Kasus Penyelesaian dengan STATCAL (Repeated-Measures ANOVA) ............ [168] 10.8 Contoh Kasus Penyelesaian dengan STATCAL (Uji Friedman) ...................................... [174] Bab 11 HUBUNGAN ANTARA VARIABEL KATEGORI....................................................... [179] 11.1 Contoh Data Variabel Kategori ............................................................................................ [179] 11.2 Data Nominal dan Ordinal.................................................................................................... [181] 11.3 Perbedaan Data Nominal dan Ordinal................................................................................. [181] 11.4 Berbagai Penjelasan Mengenai Hubungan Antara Variabel Kategori............................. [182] 11.5 Tabel Kontingensi (Contingency Table) .............................................................................. [183] 11.6 Frekuensi Pengamatan (Observed Frequency) dan Frekuensi Harapan (Expected Frequency) ..................................................................................................................................... [184] 11.7 Uji Chi-Square Pearson dan Fisher’s Exact........................................................................ [186] 11.8 Benarkah Uji Chi-Square Pearson Hanya Untuk 2×2? ..................................................... [188] 11.9 Perhitungan Manual Uji Chi-Square Pearson .................................................................... [189] 11.10 Penyelesaian dengan STATCAL......................................................................................... [192] 11.11 Penyelesaian dengan SPSS .................................................................................................. [199] 11.12 Penyelesaian dengan Minitab.............................................................................................. [202] 11.13 Apakah Uji Chi-Square Pearson Dapat Digunakan untuk 1×2 atau 2×1 atau 3×1 atau 1×3 atau 1×4 atau 4×1??? .................................................................................................... [205] 11.14 Contoh Kasus dengan STATCAL, SPSS dan Minitab ..................................................... [208] 11.15 Mengukur Keeratan Hubungan Variabel Kategori dengan Korelasi Cramer’s V........ [212]
1 BAB 1 STATCAL 1.1 Sekilas STATCAL Gambar 1.1 merupakan tampilan dari program aplikasi statistika STATCAL. Gambar 1.1 Tampilan STATCAL Dalam STATCAL terdapat 9 menu utama, yakni STATCAL, Input Numeric Data, Input Categorical Data, Graph, Descriptive, Statistics, Probability, Tutorial Video dan Guidance. Menu STATCAL menjelaskan secara ringkas mengenai STATCAL (Gambar 1.2). Menu Input Numeric Data merupakan area untuk menginput data numerik, sementara menu Input Categorical Data merupakan wilayah untuk menginput data kategori (akan dibahas secara terperinci pada Bab 2).
2 Berbagai jenis grafik, seperti grafik batang, garis dan lingkaran, dapat dibuat pada menu Graph (Gambar 1.3). Gambar 1.2 Tampilan pada Bagian STATCAL Gambar 1.3 Menu Graph Berbagai ukuran deskriptif, seperti rata-rata, standar deviasi, minimum, maksimum, serta distribusi frekuensi dan persentase, dapat dibuat pada menu Descriptive (Gambar 1.4).
3 Gambar 1.4 Menu Descriptive Metode-metode statistika seperti uji normalitas, uji kesamaan varians, uji beda dua atau lebih populasi, korelasi, regresi, structural equation modeling dan sebagainya, tersedia pada menu Statistics. Gambar 1.5 Menu Statistics Menu Probability dikhususkan terkait simulasi Monte Carlo. Menu Tutorial Video menyediakan berbagai video tutorial, yang dapat memandu Anda dalam mengolah data dengan STATCAL (Gambar 1.6). Untuk menjalankan video tutorial dalam STATCAL, pastikan terkoneksi internet.
4 Gambar 1.6 Menu Tutorial Video Berbagai tulisan terkait STATCAL dapat didownload pada menu Guidance (Gambar 1.7). Gambar 1.7 Menu Guidance STATCAL merupakan program aplikasi statistika yang dapat digunakan secara online, yakni dengan mengakses alamat http://gioprana.shinyapps.io/STATCAL atau dapat juga diinstall di komputer. Installer STATCAL dapat didownload gratis di http://www.statcal.info/. STACAL dibangun pada Januari 2017 oleh tim STATCAL, menggunakan bahasa pemrograman R di RStudio, serta menggunakan berbagai paket R (https://statcal.info/r-packages-in-statcal/) untuk melakukan analisis grafik dan statistika. STATCAL merupakan program aplikasi berbasis website. Berbasis website maksudnya ketika program aplikasi STATCAL dijalankan, maka suatu browser (misal: Google Chrome, Firefox, Internet Explorer, Opera, dan sebagainya) akan jalan secara otomatis. Di browser tersebutlah Anda bekerja, mulai dari menginput data dan melakukan berbagai analisis statistika yang Anda inginkan. Gambar 1.8 merupakan tim STATCAL.
5 Gambar 1.8 Tim STATCAL
6 1.2 Beberapa Program Aplikasi Statistika Commercial dan Gratis Berikut ini diberikan beberapa contoh program aplikasi statistika komersial (commercial). SPSS termasuk program aplikasi statistika komersial. (Anda bisa melihat harganya pada alamat https://www.ibm.com/products/spssstatistics/pricing). Gambar 1.9 Diakses Pada 7 Mei 2018 Minitab termasuk program aplikasi statistika komersial. (Anda bisa melihat harganya pada alamat http://www.minitab.com/en-us/products/minitab/pricing/). Gambar 1.10 Diakses Pada 7 Mei 2018
7 EViews juga termasuk program aplikasi statistika komersial. (Anda bisa melihat harganya pada alamat http://www.eviews.com/general/prices/prices.html). Gambar 1.11 Diakses Pada 7 Mei 2018 Berikut ini diberikan beberapa contoh program aplikasi statistika gratis. PSPP termasuk program aplikasi statistika gratis. (Anda bisa melihat pada alamat https://www.gnu.org/software/pspp/). Gambar 1.12 Diakses Pada 7 Mei 2018
8 JASP termasuk program aplikasi statistika gratis. (Anda bisa melihat pada alamat https://jasp-stats.org/download/). Gambar 1.13 Diakses Pada 7 Mei 2018 PAST termasuk program aplikasi statistika gratis. (Anda bisa melihat pada alamat https://folk.uio.no/ohammer/past/). Gambar 1.14 Diakses Pada 7 Mei 2018
9 STATCAL termasuk program aplikasi statistika gratis. (Anda bisa melihat pada alamat https://statcal.info/download-statcal/). Gambar 1.15 Diaksese Pada 7 Mei 2018
10 BAB 2 MENGINPUT DATA DI STATCAL Pada pembahasan sebelumnya telah dibahas sekilas mengenai STATCAL. Pada pembahasan kali ini akan dibahas mengenai persiapan data dan bagaimana cara menginput data di STATCAL. 2.1 Persiapan Data Misalkan diberikan data mengenai jenis kelamin, golongan darah, usia, berat badan, tinggi badan, nilai ujian matematika, fisika, kimia dan biologi dari 15 siswa (Gambar 2.1). Gambar 2.1 Data Diri dan Nilai Ujian dari 15 Siswa (Data Fiktif) Berdasarkan data pada Gambar 2.1, data dipersiapkan di Microsoft Excel. Alasan mengapa data dipersiapkan dalam Microsoft Excel adalah nantinya data tersebut dapat dipindahkan ke bagian input data di STATCAL, yakni Input Categorical Data dan Input Numeric Data. Di
11 samping itu STATCAL belum dapat menyimpan data, sehingga data disimpan di Microsoft Excel. Terdapat 3 bagian warna, yakni: Bagian warna kuning menyatakan untuk data berjenis kategori. Bagian warna pink menyatakan untuk data berjenis numerik. Sementara bagian warna hijau menyatakan label untuk data kategori, pada bagian warna kuning. Sebagai contoh, responden bernama C dengan jenis kelamin laki-laki (angka 1), golongan darah AB (angka 3). 2.2 Menginput Data Kategori di STATCAL Sekarang kita akan menginput data kategori pada Gambar 2.1 (bagian warna kuning) di STATCAL. Pilih menu Input Categorical Data (Gambar 2.2), sehingga muncul tampilan wilayah input data kategori (Gambar 2.3). Gambar 2.2 Menu Input Categorical Data Ada tiga bagian yang perlu diperhatikan, yakni bagian Categorical Data (Gambar 2.4), bagian penamaan variabel Name of Variable (Gambar 2.5) dan bagian Label (Gambar 2.6). Pada bagian Categorical Data (Gambar 2.4), bagian Set Number of Column menyatakan banyaknya variabel yang akan diinput. Diketahui jumlah variabel kategori sebanyak 2. Maka Anda dapat menginput angka 2 atau lebih besar dari 2 (misal 3, 4 ,5, 20, 100) pada di bagian Set Number of Column. Pada contoh kali ini, diinput angka 20.
12 Gambar 2.3 Wilayah Input Data Kategori Sementara bagian Set Number of Row menyatakan banyaknya pengamatan atau observasi. Diketahui jumlah pengamatan sebanyak 15 pengamatan. Maka Anda dapat menginput angka 15 atau lebih besar dari 15 (misal 20, 25, 50, 1000) pada bagian Set Number of Row. Dalam contoh ini, Set Number of Row diisi dengan angka 50. Sekarang pindahkan data kategori jenis kelamin dan golongan darah (bagian warna kuning) ke Categorical Data (Gambar 2.4). Selanjutnya beri nama variabel pada bagian Name of Variable (Gambar 2.5). Nama Jenis Kelamin untuk kolom V1, sementara nama Golongan Darah untuk kolom V2. Terakhir adalah pemberian label untuk data kategori Gambar 2.4. Pindahkan label pada Gambar 2.1 (bagian warna hijau) ke bagian Label (Gambar 2.6). Data kategori yang telah diinput dapat dilihat pada bagian Your Categorical Data (Gambar 2.7).
13 Gambar 2.4 Input Data Kategori Gambar 2.5 Penamaan Variabel Gambar 2.6 Pemberian Label
14 Gambar 2.7 Data Kategori Anda 2.3 Menginput Data Numerik di STATCAL Pada pembahasan sebelumnya telah dijelaskan langkah demi langkah menginput data kategori di STATCAL. Sekarang kita akan menginput data numerik pada Gambar 2.1 (bagian warna pink) di STATCAL, yakni bagian Input Numeric Data. Pilih menu Input Numeric Data (Gambar 2.8), sehingga muncul tampilan wilayah input data numerik (Gambar 2.9). Ada dua bagian yang perlu diperhatikan, yakni bagian Numeric Data (Gambar 2.10) dan bagian penamaan variabel Name of Variable (Gambar 2.11). Gambar 2.8 Menu Input Numeric Data Pada bagian Numeric Data (Gambar 2.10), bagian Set Number of Column menyatakan banyaknya variabel yang akan diinput. Diketahui jumlah variabel numerik sebanyak 7. Maka Anda dapat menginput angka 7 atau lebih besar dari 7 (misal 3, 4 ,5, 20, 100) pada di bagian Set Number of Column. Pada contoh kali ini, diinput angka 20. Sementara bagian Set Number of Row menyatakan banyaknya pengamatan atau observasi. Diketahui jumlah
15 pengamatan sebanyak 15 pengamatan. Maka Anda dapat menginput angka 15 atau lebih besar dari 15 (misal 20, 25, 50, 1000) pada bagian Set Number of Row. Dalam contoh ini, Set Number of Row diisi dengan angka 50. Sekarang pindahkan data numerik usia, berat badan, tinggi badan, matematika, fisika, kimia dan biologi (bagian warna kuning) ke Numeric Data (Gambar 2.10). Selanjutnya beri nama variabel pada bagian Name of Variable (Gambar 2.11). Data numerik yang telah diinput dapat dilihat pada bagian Your Numeric Data (Gambar 2.12). Gambar 2.9 Wilayah Input Data Numerik Gambar 2.10 Input Data Numerik
16 Gambar 2.11 Penamaan Variabel Gambar 2.12 Data Numerik Anda 2.4 Data Kosong (Not Available / NA) Berikut akan diberi ilustrasi mengenai data kosong atau empty data. Perhatikan data pada Gambar 2.13. Pada Gambar 2.13, data pada baris ke-14, kolom V2 kosong. Pada bagian Your Numeric Data (Gambar 2.14), data pada baris ke-14, kolom V2 berisi NA. Gambar 2.13 Ilustrasi Data Kosong
17 Gambar 2.14 Data Kosong Diisi dengan NA (Not Available) Contoh lain lagi pada Gambar 2.15, data pada baris ke-12, kolom V3 diisi dengan huruf “A”, data pada baris ke-12, kolom V4 diisi dengan kata “saya” dan data pada baris ke-14, kolom V3 diisi dengan 152,34 (menggunakan koma, bukan titik). Hasilnya diperlihatkan pada Gambar 2.16, terganti dengan NA. Gambar 2.15 Ilustrasi Data Kosong, Huruf dan Koma pada Input Data Numerik
18 Gambar 2.16 Data Numerik Anda
19 BAB 3 DESKRIPTIF Pada pembahasan sebelumnya telah dibahas bagaimana cara menginput data di STATCAL. Pada pembahasan kali ini akan dibahas mengenai statistika deskriptif, seperti membuat distribusi frekuensi dan persentase untuk data kategori dan menghitung berbagai ukuran deskriptif, seperti rata-rata, median, standar deviasi, dan sebagainya. 3.1 Distribusi Frekuensi Univariat Berdasarkan data kategori yang telah diinput pada Gambar 2.3, disajikan distribusi frekuensi dan persentase berdasarkan variabel golongan darah, seperti pada Gambar 3.1. Gambar 3.1 Distribusi Frekuensi dan Persentase berdasarkan Golongan Darah Diketahui jumlah pengamatan dengan golongan darah A sebanyak 5 (33.33%), golongan darah B sebanyak 3 (20%), golongan darah AB sebanyak 4 (26.67%) dan golongan darah O sebanyak 3 (20.00%). Untuk membuat distribusi frekuensi dan persentase univariat dalam STATCAL, pilih Descriptive => One Categorical Variable (Gambar 3.2).
20 Gambar 3.2 Menu Descriptive: One Categorical Variable Pada kotak Choose Categorical Variable (Single Choice), pindahkan variabel golongan darah ke kotak sebelah kanan. Hasilnya dapat dilihat pada bagian Result. Gambar 3.3 Menu Descriptive: One Categorical Variable Pada bagian Result juga terdapat bantuan interpretasi dan grafik batang frekuensi seperti berikut. Jenis Kelamin Frequency Percentage 1 Laki-Laki 9 60 2 Perempuan 6 40 Berdasarkan variabel Jenis Kelamin, jumlah pengamatan dengan Jenis Kelamin Laki-Laki sebanyak 9 (60.00%) dan Perempuan sebanyak 6 (40.00%). Golongan Darah Frequency Percentage 1 A 5 33.33 2 B 3 20.00 3 AB 4 26.67 4 O 3 20.00 Berdasarkan variabel Golongan Darah, jumlah pengamatan dengan Golongan Dara h A sebanyak 5 (33.33%), B sebanyak 3 (20.00%), AB sebanyak 4 (26.67%) dan O sebanyak 3 (20.00%). ######################################### ######################################### #########################################
21 Berdasarkan variabel Jenis Kelamin, jumlah pengamatan dengan Jenis Kelamin Laki-Laki sebanyak 9 (60.00%) ,sementara Perempuan sebanyak 6 (40.00%). Berdasarkan variabel Golongan Darah, jumlah pengamatan dengan Golongan Dara h A sebanyak 5 (33.33%), B sebanyak 3 (20.00%), AB sebanyak 4 (26.67%) dan O sebanyak 3 (20.00%). Gambar 3.4 Grafik Batang Frekuensi berdasarkan Golongan Darah 3.2 Distribusi Frekuensi Bivariat Berdasarkan data kategori yang telah diinput pada Gambar 2.3, disajikan distribusi frekuensi dan persentase berdasarkan variabel golongan darah dan jenis kelamin, seperti pada Gambar 3.5. Gambar 3.5 Menu Descriptive: Two Categorical Variables
22 Diketahui: Berdasarkan golongan darah A, jumlah pengamatan dengan jenis kelamin laki-laki sebanyak 3 (60%), sementara perempuan sebanyak 2 (40%). Berdasarkan golongan darah B, jumlah pengamatan dengan jenis kelamin laki-laki sebanyak 1 (33,33%), sementara perempuan sebanyak 2 (66,67%), dan seterusnya. Untuk membuat distribusi frekuensi dan persentase bivariat dalam STATCAL, pilih Descriptive => Two Categorical Variables (Gambar 3.6). Gambar 3.6 Menu Descriptive: One Categorical Variable Pada kotak Choose Categorical Variable (Single Choice) (Bagian Atas), pindahkan variabel golongan darah ke kotak sebelah kanan, sementara pada kotak Choose Categorical Variable (Single Choice) (Bagian Bawah), pindahkan variabel ke kotak sebelah kanan (Gambar 3.7). Hasilnya dapat dilihat pada bagian Result. Gambar 3.7 Menu Descriptive: Two Categorical Variables
23 Pada bagian Result juga terdapat bantuan interpretasi dan grafik batang frekuensi seperti berikut. Golongan Darah Jenis Kelamin frequency percentage 1 A Laki-Laki 3 60.00 2 A Perempuan 2 40.00 3 B Laki-Laki 1 33.33 4 B Perempuan 2 66.67 5 AB Laki-Laki 3 75.00 6 AB Perempuan 1 25.00 7 O Laki-Laki 2 66.67 8 O Perempuan 1 33.33 Diketahui jumlah pengamatan dengan Golongan Darah A dan Jenis Kelamin LakiLaki sebanyak 3 (0.60%), jumlah pengamatan dengan Golongan Darah A dan Jeni s Kelamin Perempuan sebanyak 2 (0.40%), jumlah pengamatan dengan Golongan D arah B dan Jenis Kelamin Laki-Laki sebanyak 1 (0.33%), jumlah pengamatan de ngan Golongan Darah B dan Jenis Kelamin Perempuan sebanyak 2 (0.67%), jumla h pengamatan dengan Golongan Darah AB dan Jenis Kelamin Laki-Laki sebanyak 3 (0.75%), jumlah pengamatan dengan Golongan Darah AB dan Jenis Kelamin Per empuan sebanyak 1 (0.25%), jumlah pengamatan dengan Golongan Darah O dan Je nis Kelamin Laki-Laki sebanyak 2 (0.67%), jumlah pengamatan dengan Golongan Darah O dan Jenis Kelamin Perempuan sebanyak 1 (0.33%) Golongan Darah Jenis Kelamin A B AB O Laki-Laki 3 1 3 2 Perempuan 2 2 1 1 Gambar 3.8 Grafik Batang Frekuensi berdasarkan Golongan Darah dan Jenis Kelamin
24 Gambar 3.9 Grafik Batang Frekuensi berdasarkan Golongan Darah dan Jenis Kelamin 3.3 Berbagai Ukuran Deskriptif (Rata-Rata, Standar Deviasi, dan Sebagainya) Berdasarkan data numerik yang telah diinput pada Gambar 2.9, disajikan beberapa ukuran deskriptif, seperti minimum, maksimum, rata-rata dan standar deviasi berdasarkan variabel usia, berat badan, tinggi badan, matematika, fisika, kimia dan biologi (Gambar 3.10). Gambar 3.10 Beberapa Ukuran Deskriptif berdasarkan Variabel Numerik
25 Berdasarkan Gambar 3.10, diketahui: Diketahui usia minimum adalah 15 tahun, sementara usia maksimum adalah 17. Ratarata usia adalah 15.8667, sementara nilai standar deviasi dari usia adalah 0.8338. Diketahui berat badan minimum adalah 49.12, sementara berat badan maksimum adalah 71.23. Rata-rata dari berat badan adalah 59.0967, sementara nilai standar deviasi dari berat badan adalah 5.5545, dan seterusnya. Untuk menyajikan berbagai ukuran deskriptif seperti pada Gambar 3.10, pilih Descriptive => Multiple Numeric Variables (Gambar 3.11). Gambar 3.11 Menu Descriptive: Multiple Numeric Variables Pada kotak Choose Numeric Variable (Multiple Choices), pindahkan seluruh variabel numerik ke kotak sebelah kanan (Gambar 3.12). Hasilnya dapat dilihat pada bagian Result. Gambar 3.12 Menu Descriptive: Multiple Numeric Variables
26 Pada bagian Result juga terdapat bantuan interpretasi seperti berikut. Variable Min Max mean standard deviation (sd) mean-sd mean+sd 1 Usia 15.00 17.00 15.8667 0.8338 15.0329 16.7005 2 Berat Badan 49.12 71.23 59.0967 5.5545 53.5421 64.6512 3 Tinggi Badan 149.12 171.23 159.0967 5.5545 153.5421 164.6512 4 Matematika 53.00 85.00 70.2000 8.2825 61.9175 78.4825 5 Fisika 48.00 87.00 69.6667 9.8392 59.8275 79.5058 6 Kimia 44.00 77.00 68.0000 11.2186 56.7814 79.2186 7 Biologi 47.00 87.00 69.6667 11.1590 58.5076 80.8257 Diketahui nilai minimum dari Usia adalah 15.0000, sementara nilai maksimum dari Usi a adalah 17.0000. Nilai rata-rata dari Usia adalah 15.8667, sementara nilai standar deviasi dari Usia adalah 0.8338. Diketahui nilai minimum dari Berat Badan adalah 49.1200, sementara nilai maksimum d ari Berat Badan adalah 71.2300. Nilai rata-rata dari Berat Badan adalah 59.0967, se mentara nilai standar deviasi dari Berat Badan adalah 5.5545. Diketahui nilai minimum dari Tinggi Badan adalah 149.1200, sementara nilai maksimum dari Tinggi Badan adalah 171.2300. Nilai rata-rata dari Tinggi Badan adalah 159.09 67, sementara nilai standar deviasi dari Tinggi Badan adalah 5.5545. Diketahui nilai minimum dari Matematika adalah 53.0000, sementara nilai maksimum da ri Matematika adalah 85.0000. Nilai rata-rata dari Matematika adalah 70.2000, semen tara nilai standar deviasi dari Matematika adalah 8.2825. Diketahui nilai minimum dari Fisika adalah 48.0000, sementara nilai maksimum dari F isika adalah 87.0000. Nilai rata-rata dari Fisika adalah 69.6667, sementara nilai s tandar deviasi dari Fisika adalah 9.8392. Diketahui nilai minimum dari Kimia adalah 44.0000, sementara nilai maksimum dari Ki mia adalah 77.0000. Nilai rata-rata dari Kimia adalah 68.0000, sementara nilai stan dar deviasi dari Kimia adalah 11.2186. Diketahui nilai minimum dari Biologi adalah 47.0000, sementara nilai maksimum dari Biologi adalah 87.0000. Nilai rata-rata dari Biologi adalah 69.6667, sementara nila i standar deviasi dari Biologi adalah 11.1590. Gambar 3.13 disajikan beberapa ukuran deskriptif berdasarkan jenis kelamin dan nilai matematika. Diketahui secara rata-rata, nilai matematika laki-laki lebih tinggi (72,2222) dibandingkan perempuan (67,1667). Untuk menyajikan berbagai ukuran deskriptif berdasarkan jenis kelamin dan nilai matematika seperti pada Gambar 3.13, pilih Descriptive => One Numeric Variable and One Categorical Variable (Gambar 3.14). Pada kotak Choose Categorical Variable (Single Choice), pindahkan variabel jenis kelamin ke kotak sebelah kanan, sementara pada kotak Choose Numeric Variable (Single Choice), pindahkan variabel nilai matematika ke kotak sebelah kanan.
27 Gambar 3.13 Ukuran Deskriptif berdasarkan Jenis Kelamin dan Nilai Matematika Gambar 3.14 Menu Descriptive: One Numeric Variable and One Categorical Variable Gambar 3.15 Menu Descriptive: One Numeric Variable and One Categorical Variable
28 Hasilnya dapat dilihat pada bagian Result. Pada bagian Result juga terdapat bantuan interpretasi dan grafik garis rata-rata seperti berikut. Jenis.Kelamin mean standard deviation number of observation minimum maximum mean +sd mean-sd 1 Laki-Laki 72.2222 8.1820 9 59 85 80 .4042 64.0402 2 Perempuan 67.1667 8.1588 6 53 75 75 .3255 59.0079 Diketahui Matematika minimum pada kelompok Laki-Laki adalah 59.0000 dan Matematika maksimum adalah 85.0000. Sementara nilai rata-rata Matematika pada kelompok Laki-La ki adalah 72.2222, dengan standar deviasi 8.1820. Nilai Matematika minimum pada kelompok Perempuan adalah 53.0000 dan Matematika maks imum adalah 75.0000. Sementara nilai rata-rata Matematika pada kelompok Perempuan a dalah 67.1667, dengan standar deviasi 8.1588. Gambar 3.16 Grafik Garis Rata-Rata berdasarkan Jenis Kelamin dan Nilai Matematika
29 BAB 4 UJI ASUMSI NORMALITAS POPULASI Gio dan Elly (2016:96) asumsi normalitas memiliki peranan penting dalam uji-uji parametrik, seperti uji beda rata-rata dari dua populasi dengan uji t dan analisis varians. Hal ini karena ujiuji parametrik akan bekerja dengan baik ketika asumsi normalitas dipenuhi. Conover (1999:115) menyatakan sebagai berikut. “Most parametric methods are based on the normality assumption because the theory behind the test can be worked out with the normal population distribution. The resulting procedures are efficient and powerful procedures for normally distributed data. Other parametric procedures have been developed assuming the population has other distributions, such as the exponential, Weibull, and soon.” Dalam STATCAL disediakan beberapa uji asumsi normalitas, seperti uji KolmogorovSmirnov, Shapiro-Wilk, Jarque-Bera dan Anderson-Darling. Gambar 4.1 merupakan menu untuk melakukan uji asumsi normalitas. Gambar 4.1 Menu Uji Asumsi Normalitas Berdasarkan data numerik yang telah diinput pada Gambar 2.9, akan diuji apakah data usia, berat badan, tinggi badan, matematika, fisika, kimia dan biologi berasal dari populasi yang berdistribusi normal. Untuk melakukan uji asumsi normalitas, pilih Statistics => Test of Normality (Gambar 4.1).
30 Gambar 4.2 Test of Normality (Assumption) Perhatikan Gambar 4.2. Pada kotak Choose Numeric Variable (Multiple Choices), pindahkan seluruh variabel ke kotak sebelah kanan. Hasil dari uji asumsi normalitas dapat dilihat pada bagian Result. Gambar 4.3 Hasil Uji Asumsi Normalitas dengan Uji Kolmogorov-Smirnov Berdasarkan hasil uji asumsi normalitas Kolmogorov-Smirnov pada Gambar 4.3, asumsi normalitas dipenuhi ketika nilai P-Value > tingkat signifikansi. Dalam contoh ini, tingkat
31 signifikansi yang digunakan adalah 5% atau 0,05. Diketahui asumsi normalitas untuk variabel kimia tidak dipenuhi, dikarenakan nilai P-Value 0,0327 < tingkat signifikansi 0,05. Gambar 4.4 disajikan hasil uji asumsi normalitas dengan software SPSS. Hasil uji asumsi normalitas dengan metode Kolmogorov-Smirnov antara STATCAL dan SPSS sama. Gambar 4.4 Hasil Uji Asumsi Normalitas dengan Uji Kolmogorov-Smirnov (Software SPSS) Selain uji normalitas Kolmogorov-Smirnov, dalam STATCAL juga disediakan uji normalitas Jarque-Bera. Gambar 4.5 disajikan hasil uji normalitas dengan uji Jarque-Bera. Gambar 4.5 Hasil Uji Asumsi Normalitas dengan Uji Jarque-Bera
32 Berdasarkan hasil uji asumsi normalitas Jarque-Bera pada Gambar 4.5, asumsi normalitas dipenuhi ketika nilai P-Value > tingkat signifikansi. Dalam contoh ini, tingkat signifikansi yang digunakan adalah 5% atau 0,05. Diketahui asumsi normalitas untuk seluruh variabel dipenuhi, dikarenakan seluruh nilai P-Value > tingkat signifikansi 0,05. Gambar 4.6 disajikan hasil uji asumsi normalitas dengan software EViews. Hasil uji asumsi normalitas dengan metode Jarque-Bera antara STATCAL dan EViews sama. Gambar 4.6 Hasil Uji Asumsi Normalitas dengan Uji Jarque-Bera Pada menu Result untuk Test of Normality juga disisipkan grafik boxplot, seperti pada Gambar 4.7. Gambar 4.7 Grafik Boxplot
33 BAB 5 UJI ASUMSI KESAMAAN VARIANS POPULASI Uji asumsi kesamaan varians populasi menguji suatu asumsi, apakah dua atau lebih sampel ditarik dari populasi-populasi dengan varians yang sama. Gio dan Elly (2016:107) metode statistika yang dapat digunakan untuk menguji asumsi kesamaan varians populasi adalah uji Levene, uji , uji Hartley, dan uji Bartlett. Varians populasi dilambangkan dengan 2 , sedangkan varians sampel dilambangkan dengan 2 . (A) (B) (C) 2 = 2 = 2 Gambar 5.1 Pada Gambar 7.1, varians dari populasi A, B, dan C adalah sama, namun rata-ratanya berbeda. Pada Gambar 7.2, varians dari populasi A dan B sama, namun berbeda dengan C. (A) (B) (C) Gambar 5.2 Gio dan Elly (2016:107) hipotesis nol menyatakan tidak terdapat perbedaan varians di antara populasi, sedangkan hipotesis alternatif menyatakan terdapat paling tidak sepasang varians populasi yang berbeda. Field (2009:150) menyatakan sebagai berikut.
34 “Levene's test tests null hypothesis that the variances in different groups are equal (i.e. the difference between the variances is zero).” Dalam STATCAL disediakan beberapa metode statistika untuk menguji asumsi kesamaan varians populasi, seperti uji Levene dan uji Bartlett. Gambar 5.3 merupakan menu untuk melakukan uji asumsi kesamaan varians populasi. Gambar 5.3 Menu Uji Asumsi Kesamaan Varians Populasi Berdasarkan data kategori dan numerik yang telah diinput pada Gambar 2.3 dan Gambar 2.9, akan diuji suatu asumsi, apakah data nilai matematika laki-laki dan data nilai matematika perempuan berasal dari populasi-populasi yang dengan varians yang sama, yakni 0: _− 2 = _ 2 Untuk melakukan uji asumsi kesamaan varians populasi, pilih Statistics => Test of Homogeneity of Variance (Gambar 5.3). Perhatikan Gambar 5.4. Pada kotak Choose Numeric Variable (Single Choice), pindahkan nilai matematika ke kotak sebelah kanan. Sementara pada kotak Choose Categorical Variable (Single Choice), pindahkan variabel jenis kelamin ke kotak sebelah kanan. Hasilnya dapat dilihat pada bagian Result.
35 Gambar 5.4 Test of Homogeneity of Variance (Assumption) Hasil pada bagian Result pertama menampilkan grafik boxplot, seperti pada Gambar 5.5. Grafik boxplot pada Gambar 5.5 menampilkan sebaran data untuk data nilai matematika lakilaki dan data nilai matematika perempuan. Gambar 5.5 Grafik Boxplot
36 Selanjutnya, pada bagian Result menampilkan hasil uji asumsi kesamaan varians populasi dengan uji Levene, seperti pada Gambar 5.6. Berdasarkan hasil uji Levene pada Gambar 5.6, diketahui nilai statistik Levene adalah 0,0002 dengan P-Value 0,9904 > tingkat signifikansi 0,05, maka asumsi bahwa data nilai matematika laki-laki dan data nilai matematika perempuan berasal dari populasi-populasi dengan varians yang sama dipenuhi. Gambar 5.6 Hasil Uji Asumsi Kesamaan Varians Populasi dengan Uji Levene Gambar 5.7 diperlihatkan hasil uji asumsi kesamaan varians populasi dengan uji Levene berdasarkan software SPSS. Gambar 5.7 Hasil Uji Asumsi Kesamaan Varians Populasi dengan Uji Levene berdasarkan Software SPSS Selain uji Levene, pada bagian Result juga menampilkan hasil uji asumsi kesamaan varians populasi dengan uji Bartlett, seperti pada Gambar 5.8. Berdasarkan hasil uji Bartlett pada Gambar 5.8, diketahui nilai statistik Bartlett adalah 0 dengan P-Value 0,9946 > tingkat signifikansi 0,05, maka asumsi bahwa data nilai matematika laki-laki dan data nilai matematika perempuan berasal dari populasi-populasi dengan varians yang sama dipenuhi.
37 Gambar 5.8 Hasil Uji Asumsi Kesamaan Varians Populasi dengan Uji Bartlett Pada bagian Result juga menampilkan hasil uji asumsi normalitas dengan uji KolmogorovSmirnov, seperti pada Gambar 5.9. Berdasarkan hasil uji asumsi normalitas pada Gambar 5.9, diketahui nilai P-Value untuk baris laki-laki adalah 0,981 > tingkat signifikansi 0,05, sehingga asumsi bahwa data nilai matematika laki-laki berasal dari populasi berdistribusi normal dipenuhi. Sementara diketahui nilai P-Value untuk baris perempuan adalah 0,912 > tingkat signifikansi 0,05, sehingga asumsi bahwa data nilai matematika perempuan berasal dari populasi berdistribusi normal dipenuhi. Gambar 5.9 Hasil Uji Asumsi Normalitas Populasi dengan Uji Kolmogorov-Smirnov
38 BAB 6 UJI BEDA DUA SAMPEL BERPASANGAN 6.1 Contoh Kasus Uji Beda 2 Sampel Berpasangan Misalkan diberikan data berat badan dari 6 responden, sebelum mengkonsumsi obat diet ABCD dan setelah mengkonsumsi obat diet ABCD selama 1 bulan. Tabel 6.1 Data Berat Badan Sebelum dan Setelah Mengkonsumsi Obat Diet ABCD selama 1 Bulan Nama Berat Badan (Obat Diet ABCD) Sebelum Sesudah Ugi 85 84 Egi 79 74 Andi 83 80 Intan 77 76 Sari 85 83 Wati 78 77 Rata-Rata 81.167 79.000 Berdasarkan data pada Tabel 6.1, diketahui: Responden bernama Ugi, berat badan sebelum mengkonsumsi obat diet ABCD adalah 85 kg, berat badan setelah mengkonsumsi obat diet ABCD selama 1 bulan turun menjadi 84 kg. Responden bernama Sari, berat badan sebelum mengkonsumsi obat diet ABCD adalah 85 kg, berat badan setelah mengkonsumsi obat diet ABCD selama 1 bulan turun menjadi 83 kg. Rata-rata berat badan sebelum mengkonsumsi obat diet ABCD adalah 81,167, sementara rata-rata berat badan setelah mengkonsumsi obat diet ABCD adalah 79.
39 Secara rata-rata, terjadi penurunan berat badan setelah mengkonsumsi obat diet ABCD selama 1 bulan. Apakah penurunan tersebut signifikan secara statistika (berdasarkan hasil uji statistika)? Uji t 2 sampel berpasangan (paired-samples t test) atau uji Wilcoxon dapat digunakan untuk menguji hipotesis apakah terdapat perbedaan berat badan yang signifikan (secara statistika / berdasarkan pengujian statistika), sebelum dan sesudah mengkonsumsi obat diet ABCD selama 1 bulan. Data pada Tabel 6.1 jika diinput dalam SPSS seperti pada Gambar 6.1. Gambar 6.1 Data Tabel 6.1 Diinput dalam SPSS Misalkan diberikan data nilai ujian matematika dari 6 responden, sebelum mengikuti kursus dan setelah mengikuti kegiatan kursus matematika selama 1 bulan. Tabel 6.2 Data Nilai Ujian Matematika Sebelum dan Sesudah Mengikuti Kurus Matematika selama 1 Bulan Nama Nilai Matematika Sebelum Ikut Kursus Sesudah Ikut Kursus 1 Bulan Ugi 65 87 Egi 54 89 Udin 67 95 Rina 70 90 Ricis 55 89 Suci 67 86 Didin 56 85
40 Anto 56 85 Ani 61 96 Rata-Rata 61.222 89.111 Berdasarkan data pada Tabel 6.2, diketahui: Responden bernama Ugi, nilai ujian matematika sebelum mengikuti kegiatan kurus adalah 65, setelah mengikuti kegiatan kursus selama 1 bulan, nilai ujian matematikanya meningkat menjadi 87. Responden bernama Ani, nilai ujian matematika sebelum mengikuti kegiatan kurus adalah 61, setelah mengikuti kegiatan kursus selama 1 bulan, nilai ujian matematikanya meningkat menjadi 96. Secara rata-rata, terjadi peningkatan nilai ujian matematika setelah mengikuti kegiatan kursus selama 1 bulan. Apakah peningkatan tersebut signifikan secara statistika (berdasarkan hasil uji statistika)? Uji t 2 sampel berpasangan (paired-samples t test) atau uji Wilcoxon dapat digunakan untuk menguji hipotesis apakah terdapat perbedaan nilai ujian matematika yang signifikan (secara statistika / berdasarkan pengujian statistika), sebelum dan sesudah mengikuti kegiatan kursus selama 1 bulan. Data pada Tabel 6.2 jika diinput dalam SPSS seperti pada Gambar 6.2. Gambar 6.2 Data Tabel 6.2 Diinput dalam SPSS
41 6.2 Beberapa Kutipan Isi Buku Mengenai Uji t 2 Sampel Berpasangan dan Uji Wilcoxon Andy Field (2009:329) dalam bukunya yang berjudul “Discovering Statistics Using SPSS, 3rd Edition” menyatakan sebagai berikut. “9.4.3. The dependent t-test and the assumption of normality We talked about the assumption of normality in Chapter 5 and discovered that parametric tests (like the dependent t-test) assume that the sampling distribution is normal. This should be true in large samples, but in small samples people often check the normality of their data because if the data themselves are normal then the sampling distribution is likley to be also. With the dependent t-test we analyse the differences between scores because we’re interested in the sampling distribution of these differences (not the raw data). Therefore, if you want to test for normality before a dependent t-test then what you should do is compute the differences between scores, and then check if this new variable is normally distributed (or use a big sample and not worry about normality!). It is possible to have two measures that are highly nonnormal that produce beautifully distributed differences!” Dalam konteks ini, kapan ukuran sampel dikatakan besar? Ukuran sampel dikatakan cukup besar ketika di atas 30. Murray R. Spiegel dan Larry J. Stephens (2008:275-276) dalam bukunya yang berjudul “Statistics 4th Edition” menyatakan sebagai berikut. “In previous chapters we often made use of the fact that for samples of size N > 30, called large samples, the sampling distributions of many statistics are approximately normal, the approximation becoming better with increasing N. For samples of size N < 30, called small samples, this approximation is not good and becomes worse with decreasing N, so that appropriate modifications must be made. A study of sampling distributions of statistics for small samples is called small sampling theory. However, a more suitable name would be exact sampling theory, since the results obtained hold for large as well as for small samples. In this chapter we study three important distributions: Student’s t distribution, the chi-square distribution, and the F distribution. For large values of or (certainly ≥ 30) the curves (2) closely approximately the standardized normal curve = 1 √2 −( 1 2 ) 2 Andy Field (2009:552) dalam bukunya yang berjudul “Discovering Statistics Using SPSS, 3rd Edition” menyatakan sebagai berikut. “The Wilcoxon signed-rank test (Wilcoxon, 1945), not to be confused with the rank-sum test in the previous section, is used in situations in which there are two sets of scores to compare, but these scores come from the same participants. As such, think of it as the non-parametric equivalent of the dependent t-test (or a Mann–Whitney test for repeatedmeasures data). The Wilcoxon signed-rank test works in a fairly similar way to the dependent t-test (Chapter 9) in that it is based on the differences between scores in the two conditions you’re comparing. Once these differences have been calculated they are ranked (just like in section 15.3.1) but the sign of the difference (positive or negative) is assigned to the rank. If we use the same data as before we can compare depression scores on Sunday to those on Wednesday for the two drugs separately.”