39 untuk memberikan pemahaman tentang cara metode klasifikasi bekerja, pemilihan metode klasifikasi yang tepat dan penerapan metode tersebut untuk menyelesaikan berbagai masalah dalam digital learning, serta meningkatkan pembelajaran digital. Topik-topik yang akan dibahas: 1. Jenis-jenis metode klasifikasi 2. Pemilihan metode klasifikasi yang tepat 3. Penerapan metode klasifikasi dalam digital learning 4. Tantangan dan pertimbangan etis 5. Kesimpulan A. Jenis-jenis Metode Klasifikasi Berikut adalah penjelasan singkat dari beberapa jenis metode klasifikasi yang umum digunakan: 1. Naive Bayes Classifier: Merupakan algoritma probabilistik sederhana yang mengasumsikan independensi fitur. Metode ini cepat, mudah dipahami, dan efisien dalam menangani data sparse. Namun kurang akurat dibandingkan dengan metode lain, terutama ketika asumsi independensi fitur tidak terpenuhi. 2. Support Vector Machine (SVM): Merupakan algoritma klasifikasi yang memaksimalkan margin antara kelas data yang berbeda. Metode ini efektif dalam menangani data dengan dimensi tinggi dan non-linear. Mempunyai komplek-
40 sitas komputasi yang lebih tinggi dibanding-kan dengan Naive Bayes. 3. Decision Tree: Decision tree adalah model yang memprediksi kelas data berdasarkan serangkaian aturan yang dipelajari dari data. Mudah dipahami dan diinterpretasikan, memungkinkan visualisasi yang jelas dari aturan klasifikasi. Namun cenderung overfitting dan sensitif terhadap noise dalam data. 4. Random Forest: Ensemble model yang menggabungkan beberapa decision tree untuk meningkatkan akurasi dan stabilitas. Sangat akurat dan robust terhadap overfitting. Random Forest membutuhkan waktu training yang lebih lama dibandingkan dengan decision tree tunggal. 5. Neural Network: Model yang terinspirasi dari struktur otak manusia, mampu mempelajari pola kompleks dalam data. Sangat akurat dan fleksibel, dapat diterapkan pada berbagai jenis data. Neural Networl membutuhkan data yang besar untuk training dan kompleks untuk diinterpretasikan.
41 Tabel 1. Perbandingan Kelebihan dan Kekurangan Metode Klasifikasi Metode Klasifikasi Kelebihan Kekurangan Naive Bayes Classifier Cepat, mudah dipahami, efisien dalam menangani data sparse Kurang akurat dibandingkan dengan metode lain, asumsi independensi fitur Support Vector Machine (SVM) Efektif dalam menangani data dengan dimensi tinggi dan non-linear Kompleksitas komputasi yang lebih tinggi Decision Tree Mudah dipahami dan diinterpretasikan, memungkinkan visualisasi aturan klasifikasi Cenderung overfitting, sensitif terhadap noise Random Forest Sangat akurat, robust terhadap overfitting Membutuhkan waktu training yang lebih lama Neural Network Sangat akurat dan fleksibel, dapat diterapkan pada berbagai jenis data Membutuhkan data yang besar untuk training, kompleks untuk diinterpretasikan
42 B. Pemilihan Metode Klasifikasi yang Tepat Memilih metode klasifikasi yang tepat untuk digital learning merupakan langkah penting untuk mencapai hasil yang optimal. Berikut metode yang tepat untuk beberapa faktor yang perlu dipertimbangkan: 1. Jenis Data a. Numerik: K-Nearest Neighbors (KNN), Support Vector Machines (SVM), Naive Bayes b. Kategorikal: Decision Tree, Naive Bayes, Logistic Regression c. Teks: Naive Bayes, Support Vector Machines (SVM), Random Forest 2. Tujuan Klasifikasi a. Prediksi: KNN, SVM, Random Forest b. Klasifikasi: Decision Tree, Naive Bayes, Logistic Regression c. Deteksi anomali: KNN, SVM, Local Outlier Factor (LOF) 3. Kompleksitas Model a. Sederhana: Naive Bayes, Decision Tree b. Kompleks: SVM, Random Forest, Neural Networks 4. Ketersediaan Sumber Daya a. Komputasi: SVM, Neural Networks membutuhkan komputasi yang lebih besar
43 b. Data: KNN membutuhkan data yang lebih besar untuk performa optimal Di samping itu, juga ada beberapa metode untuk faktor lainnya: 1. Kemampuan interpretasi: Decision Tree lebih mudah diinterpretasi dibandingkan SVM 2. Ketahanan terhadap noise: KNN lebih tahan terhadap noise dibandingkan SVM 3. Kemampuan skalabilitas: Random Forest lebih scalable dibandingkan Decision Tree Tips untuk memilih metode klasifikasi yang tepat: a. Identifikasi tujuan klasifikasi. b. Pahami jenis data yang tersedia. c. Pertimbangkan kompleksitas model dan ketersediaan sumber daya. d. Evaluasi beberapa metode klasifikasi dan bandingkan performanya. e. Gunakan teknik validasi silang untuk memastikan hasil yang reliable. Memilih metode klasifikasi yang tepat adalah kunci untuk mencapai hasil yang optimal dalam digital learning. Dengan mempertimbangkan faktor-faktor yang relevan dan mengevaluasi berbagai metode, kita dapat memilih metode yang paling sesuai dengan kebutuhan dan tujuan.
44 Contoh skenario penerapan metode klasifikasi: 1. K-Nearest Neighbors (KNN) a. Prediksi kinerja peserta didik. KNN dapat memprediksi nilai ujian peserta didik berdasarkan nilai ujian dan data demografi peserta didik lain yang serupa. b. Rekomendasi konten pembelajaran. KNN dapat merekomendasikan konten pembelajaran yang relevan berdasarkan riwayat pembelajaran dan preferensi peserta didik lain yang serupa. 2. Support Vector Machines (SVM) a. Deteksi kecurangan dalam ujian online. SVM dapat mendeteksi pola yang tidak biasa dalam jawaban peserta didik dan menandai kemungkinan kecurangan. b. Klasifikasi gaya belajar: SVM dapat mengklasifikasikan gaya belajar peserta didik berdasarkan aktivitas online dan preferensi belajar mereka. 3. Naive Bayes a. Prediksi risiko dropout. Naive Bayes dapat memprediksi kemungkinan peserta didik dropout berdasarkan faktor-faktor seperti prestasi akademik, latar belakang keluarga, dan keterlibatan dalam pembelajaran. b. Klasifikasi topik teks. Naive Bayes dapat mengklasifikasikan topik teks dalam tugas-tugas menulis online.
45 4. Random Forest a. Personalisasi pembelajaran. Random Forest dapat membantu membuat rencana pembelajaran yang dipersonalisasi untuk setiap peserta didik berdasarkan berbagai faktor, seperti gaya belajar, prestasi akademik, dan minat. b. Optimalisasi sistem pendidikan. Random Forest dapat membantu menganalisis data pendidikan untuk mengidentifikasi area yang perlu diperbaiki dan mengalokasikan sumber daya secara optimal. 5. Decision Tree a. Diagnosis kesulitan belajar. Decision Tree dapat membantu mendiagnosis kesulitan belajar peserta didik berdasarkan gejala dan faktor-faktor lainnya. b. Membuat aturan adaptif. Decision Tree dapat digunakan untuk membuat aturan adaptif yang menyesuaikan pembelajaran berdasarkan kemajuan dan kebutuhan individual peserta didik. Setiap metode klasifikasi memiliki kelebihan dan kekurangannya sendiri. Dengan memilih metode yang tepat dan menerapkannya dengan cermat, kita dapat meningkatkan efektivitas dan personalisasi pembelajaran dalam digital learning.
46 C. Penerapan Metode Klasifikasi dalam Digital Learning Metode klasifikasi memainkan peran penting dalam digital learning, memungkinkan prediksi dan klasifikasi data yang berkaitan dengan pembelajaran dan peserta didik. Berikut adalah beberapa contoh penerapan metode klasifikasi dalam menyelesaikan permasalahan digital learning: 1. Prediksi kinerja peserta didik Klasifikasi dapat digunakan untuk memprediksi kemungkinan peserta didik untuk berhasil dalam suatu kursus atau program pembelajaran. Hal ini dapat membantu pendidik untuk: a. Mengidentifikasi peserta didik yang berisiko gagal dan memberikan perhatian lebih awal. b. Memprediksi nilai akhir peserta didik. c. Menyusun program pembelajaran yang sesuai dengan kebutuhan individual peserta didik. 2. Klasifikasi gaya belajar Klasifikasi dapat digunakan untuk mengidentifikasi gaya belajar individual peserta didik, sehingga konten pembelajaran dapat disesuaikan dengan kebutuhan mereka. Hal ini dapat membantu pendidik untuk: a. Menyusun konten pembelajaran yang sesuai dengan gaya belajar peserta didik.
47 b. Memberikan tips dan strategi belajar yang sesuai dengan gaya belajar peserta didik. c. Meningkatkan motivasi dan keterlibatan peserta didik dalam pembelajaran. 3. Rekomendasi konten pembelajaran. Klasifikasi dapat digunakan untuk merekomendasikan konten pembelajaran yang sesuai dengan minat dan tingkat kemampuan peserta didik. Hal ini dapat membantu pendidik untuk: a. Memberikan peserta didik akses ke konten pembelajaran yang relevan dan bermanfaat. b. Meningkatkan personalisasi pembelajaran. c. Meningkatkan motivasi dan keterlibatan peserta didik dalam pembelajaran. 4. Deteksi kecurangan. Klasifikasi dapat digunakan untuk mendeteksi kecurangan dalam ujian online atau aktivitas pembelajaran lainnya. Hal ini dapat membantu pendidik untuk: a. Menjaga integritas dan keadilan proses pembelajaran. b. Mencegah plagiarisme dan bentuk kecurangan lainnya. c. Meningkatkan kepercayaan terhadap hasil pembelajaran. Contoh studi kasus penerapan klasifikasi data dalam digital learning:
48 5. Prediksi keberhasilan peserta didik a. Metode: Naive Bayes b. Data: Demografi, nilai ujian, aktivitas belajar online c. Hasil: Prediksi kemungkinan peserta didik untuk berhasil dengan akurasi tinggi d. Manfaat: Membantu pengajar dalam memberikan intervensi yang tepat sasaran dan meningkatkan hasil belajar 6. Rekomendasi Konten Pembelajaran a. Metode: Support Vector Machine (SVM) b. Data: Riwayat pembelajaran, minat, preferensi belajar, konten pembelajaran c. Hasil: Rekomendasi konten pembelajaran yang relevan dan menarik dengan akurasi tinggi d. Manfaat: Meningkatkan personalisasi pembelajaran, motivasi, dan keterlibatan peserta didik, dan hasil belajar 7. Deteksi Kecurangan dalam Ujian Online a. Metode: Random Forest b. Data: Jawaban peserta didik, waktu pengerjaan, pola akses internet c. Hasil: Deteksi kecurangan dengan tingkat akurasi tinggi d. Manfaat: Meningkatkan integritas dan kredibilitas pembelajaran online, mencegah kecurangan, dan meningkatkan hasil belajar yang adil dan objektif
49 8. Pengelompokan Peserta Didik Berdasarkan Gaya Belajar a. Metode: K-Means Clustering b. Data: Gaya belajar, preferensi belajar, aktivitas online c. Hasil: Pengelompokan peserta didik dengan gaya belajar yang similar untuk memberikan pembelajaran yang lebih personal d. Manfaat: Meningkatkan efektivitas pembelajaran dan hasil belajar 9. Prediksi Risiko Dropout a. Metode: Logistic Regression b. Data: Demografi, prestasi akademik, faktor sosialekonomi c. Hasil: Prediksi kemungkinan peserta didik untuk dropout d. Manfaat: Membantu pengajar dalam memberikan intervensi dini untuk mencegah dropout D. Tantangan dan Pertimbangan Etis dalam penggunaan Metode Klasifikasi dalam Digital Learning Penggunaan metode klasifikasi dalam digital learning menawarkan banyak manfaat, seperti prediksi kinerja, personalisasi, dan deteksi kecurangan. Namun, terdapat beberapa tantangan yang perlu dipertimbangkan yaitu:
50 1. Bias Data Data yang digunakan untuk melatih model klasifikasi dapat mengandung bias, yang dapat menyebabkan hasil yang tidak adil atau tidak akurat. Contoh: Data demografi, nilai ujian, atau aktivitas online dapat mengandung bias yang mencerminkan stereotip atau diskriminasi. Solusi: a. Gunakan teknik debiasing data untuk membersihkan data dari bias. b. Gunakan dataset yang beragam dan representatif dari berbagai kelompok populasi. c. Lakukan audit algoritma untuk mengidentifikasi dan meminimalisir bias. 2. Privasi Data Penggunaan data pribadi peserta didik untuk melatih model klasifikasi dapat menimbulkan kekhawatiran privasi. Data sensitif seperti nilai ujian, riwayat pembelajaran, dan informasi pribadi lainnya dapat disalahgunakan. Solusi: a. Dapatkan persetujuan dari peserta didik sebelum menggunakan data mereka. b. Gunakan teknik anonimisasi data untuk melindungi privasi. c. Terapkan kebijakan privasi yang ketat dan transparan.
51 3. Fairness dan Akuntabilitas Penting untuk memastikan bahwa model klasifikasi digunakan secara adil dan akuntabel. Algoritma harus transparan dan dapat diaudit untuk memastikan tidak ada diskriminasi atau bias. Solusi: a. Gunakan algoritma yang explainable AI (XAI) untuk menjelaskan bagaimana model klasifikasi membuat keputusan. b. Buat sistem pelaporan untuk memungkinkan peserta didik menantang hasil klasifikasi yang tidak adil. c. Terapkan kerangka kerja etika untuk memandu penggunaan algoritma. Selain tantangan di atas, juga terdapat beberapa tantangan lain yang dapat menjadi kendala, seperti: 1. Kurangnya keahlian dan sumber daya untuk menerapkan metode klasifikasi. 2. Kesulitan dalam menginterpretasikan hasil klasifikasi. 3. Potensi penyalahgunaan metode klasifikasi untuk tujuan yang tidak etis. Meskipun terdapat beberapa tantangan, penggunaan metode klasifikasi dalam digital learning dapat memberikan banyak manfaat. Dengan mengatasi tantangan ini secara bertanggung jawab, kita dapat memastikan bahwa teknologi ini digunakan untuk meningkatkan pendidikan dan pembelajaran bagi semua orang.
52 Dalam mengatasi tantangan di atas, kita juga perlu memperhatikan pertimbangan etis saat menggunakan metode klasifikasi dalam digital learning, antara lain: 1. Keadilan dan Kesetaraan Keadilan dan kesetaraan dalam proses pendidikan harus tetap dijaga, maka pastikan model klasifikasi tidak membeda-bedakan atau memperlakukan peserta didik secara tidak adil berdasarkan ras, gender, agama, atau latar belakang lainnya. Gunakan dataset yang beragam dan representatif untuk melatih model klasifikasi. Kemudian dilakukan audit algoritma untuk mengidentifikasi dan meminimalkan bias. 2. Privasi dan Keamanan Data Untuk menjaga keamanan data perlu mendapatkan persetujuan dari peserta didik sebelum menggunakan data mereka. Kita perlu menggunakan teknik anonimisasi data untuk melindungi privasi. Kebijakan privasi yang ketat dan transparan juga harus diterapkan. Setelah itu amankan data dari akses yang tidak sah. 3. Transparansi dan Akuntabilitas Transparasi bisa dilakukan dengan menjelaskan kepada peserta didik bagaimana model klasifikasi digunakan dan bagaimana data mereka digunakan. Sistem pelaporan perlu dibuat untuk memungkinkan peserta didik mempertanyakan jika hasil klasifikasi yang tidak adil. Selain akuntabilitas dengan
53 pelaporan, juga terapkan kerangka kerja etika untuk memandu penggunaan algoritma. 4. Konsensus dan Partisipasi Dalam proses pengambilan keputusan tentang penggunaan metode klasifikasi, harus melibatkan pemangku kepentingan, seperti: peserta didik, orang tua, guru, dan pakar etika, Pertimbangkan berbagai perspektif dan kekhawatiran. Kemudian buatkan proses yang transparan dan akuntabel untuk pengambilan keputusan. 5. Potensi Penyalahgunaan Kita harus memastikan metode klasifikasi tidak digunakan untuk tujuan yang tidak etis, seperti: diskriminasi, pelacakan, atau manipulasi agar tidak terjadi penyalahgunaan. Selain itu perlu penerapan pengamanan dan mengedukasi penggunanya agar menggunakan metode klasifikasi secara bertanggung jawab. Dengan menerapkan prinsip-prinsip keadilan, privasi, transparansi, dan akuntabilitas, kita dapat memastikan bahwa teknologi ini digunakan untuk meningkatkan pendidikan dan pembelajaran bagi semua orang. E. Kesimpulan Berbagai metode klasifikasi, seperti Naïve Bayes, SVM, Random Forest, dan K-Means Clustering, dapat digunakan dalam digital learning untuk berbagai tujuan, seperti: prediksi kinerja peserta didik, rekomendasi
54 konten pembelajaran, deteksi kecurangan dalam ujian online, pengelompokan peserta didik berdasarkan gaya belajar, dan prediksi risiko dropout. Dalam penggunaan metode klasifikasi terdapat beberapa tantangan, yaitu: bias data, privasi data, fairness dan akuntabilitas. Tantangan tersebut bisa diatasi dengan beberapa solusi, antara lain: teknik debiasing data, persetujuan dari peserta didik, teknik anonimisasi data, audit algoritma, penerapan kebijakan privasi yang ketat, penggunaan algoritma XAI, adanya sistem pelaporan, dan penerapan kerangka kerja etika. Selain tantangan dan solusi, kita perlu memperhatikan pertimbangan etis seperti: keadilan dan kesetaraan, privasi dan keamanan data, transparansi dan akuntabilitas. konsensus dan partisipasi, juga potensi penyalahgunaan. Metode klasifikasi memainkan peran penting dalam digital learning, membuka peluang baru untuk meningkatkan pengalaman belajar dan hasil belajar bagi semua. Prospek pengembangan di masa depan: 1. Pembelajaran adaptif: Sistem pembelajaran adaptif yang canggih akan menggunakan metode klasifikasi untuk menyesuaikan pembelajaran secara real-time berdasarkan kebutuhan dan kemajuan individual peserta didik. 2. Analisis data yang lebih mendalam: Teknik pembelajaran mesin yang lebih canggih akan memungkinkan analisis data yang lebih mendalam untuk mendapatkan wawasan yang lebih kaya tentang pembelajaran dan perilaku peserta didik.
55 3. Algoritma yang lebih adil dan transparan: Algoritma akan dikembangkan untuk memastikan semua peserta didik mendapatkan manfaat dari teknologi ini tanpa bias atau diskriminasi. Metode klasifikasi merupakan fondasi penting untuk masa depan digital learning. Dengan pengembangan yang berkelanjutan, metode ini akan terus memainkan peran penting dalam menciptakan pengalaman belajar yang lebih personal, efektif, dan adil bagi semua.
56 Metode Asosiasi dan Penemuan Pola dalam Digital Learning Neny Rosmawarni, M.Kom etode Asosiasi dan Penemuan Pola adalah teknik analisis data yang digunakan untuk menemukan hubungan dan pola tersembunyi dalam kumpulan data besar. Metode ini sering digunakan dalam berbagai bidang, termasuk pembelajaran mesin, analisis bisnis, dan pembelajaran digital. Dalam konteks pembelajaran digital, Metode Asosiasi dan Penemuan Pola digunakan untuk mengidentifikasi keterkaitan antara elemen-elemen pembelajaran, seperti materi pembelajaran, gaya belajar siswa, interaksi di platform pembelajaran, dan hasil belajar. Dengan menganalisis data yang dihasilkan dari platform pembelajaran digital, metode ini dapat membantu dalam: 1. Mengidentifikasi hubungan antara konten pembelajaran yang berbeda. 2. Memahami preferensi belajar siswa. M
57 3. Menemukan pola perilaku belajar yang dapat digunakan untuk meningkatkan pengalaman pembelajaran. 4. Mempersonalisasi pengalaman pembelajaran untuk setiap siswa berdasarkan pola yang ditemukan. Contoh algoritma yang sering digunakan dalam Metode Asosiasi adalah Algoritma Apriori dan FP-Growth. Algoritma ini bekerja dengan mencari item-item yang sering muncul bersama dalam kumpulan data (itemset) untuk menemukan asosiasi antara mereka. Secara umum, Metode Asosiasi dan Penemuan Pola merupakan alat penting dalam analisis data pembelajaran digital yang dapat membantu meningkatkan efektivitas pembelajaran, memahami perilaku belajar siswa dan mendukung pengambilan keputusan yang lebih baik dalam pengelolaan pembelajaran. A. Konsep Dasar Asosiasi dalam Konteks Pembelajaran Digital Konsep dasar asosiasi dalam konteks pembelajaran digital mengacu pada identifikasi keterkaitan atau hubungan antara berbagai elemen pembelajaran, seperti materi pembelajaran, gaya belajar siswa, interaksi di platform pembelajaran, dan hasil belajar. Konsep ini didasarkan pada asumsi bahwa terdapat pola atau asosiasi yang dapat ditemukan dalam data pembelajaran digital yang relevan dengan pengalaman belajar siswa. Seberapa konsep dasar yang penting dalam asosiasi pembelajaran digital termasuk:
58 1. Itemset: Itemset merujuk pada kumpulan item atau elemen pembelajaran yang dipertimbangkan bersama. Dalam konteks pembelajaran digital, itemset dapat berupa topik atau materi pembelajaran, aktivitas pembelajaran, atau atribut lain yang relevan dengan pengalaman belajar. 2. Aturan Asosiasi: Aturan asosiasi adalah pernyataan yang menunjukkan hubungan antara satu set item ke item lain dalam data. Contohnya, "Jika seorang siswa menyelesaikan tugas A, maka kemungkinan besar dia juga akan menyelesaikan tugas B." 3. Support: Support mengukur seberapa sering suatu itemset muncul dalam data pembelajaran digital. Nilai support yang tinggi menunjukkan bahwa itemset tersebut sering terjadi bersama. 4. Confidence: Confidence mengukur seberapa sering aturan asosiasi terbukti benar dalam data. Nilai confidence yang tinggi menunjukkan bahwa hubungan antara item-item dalam aturan asosiasi tersebut kuat. 5. Lift: Lift adalah ukuran dari seberapa banyak aturan asosiasi meningkatkan kemungkinan terjadinya suatu kejadian dibandingkan dengan kemungkinan kejadian itu terjadi secara independen. Lift yang lebih besar dari 1 menunjukkan bahwa adanya hubungan antara item-item tersebut lebih besar daripada kejadian acak. Dengan menggunakan konsep dasar ini, analisis asosiasi dalam pembelajaran digital dapat membantu dalam memahami pola belajar siswa, mengidentifikasi keterkaitan antara berbagai elemen pembelajaran, dan mendukung pengambilan keputusan yang lebih baik
59 dalam merancang pengalaman pembelajaran yang efektif dan disesuaikan dengan kebutuhan siswa. B. Algoritma Asosiasi yang Umum Digunakan Beberapa algoritma asosiasi yang umum digunakan dalam analisis data, termasuk dalam konteks pembelajaran digital, adalah: 1. Apriori Algorithm: Ini adalah salah satu algoritma asosiasi paling populer. Apriori bekerja dengan mengidentifikasi item-item yang sering muncul bersama dalam kumpulan data (itemset) dan menggunakan prinsip "apriori" untuk menghasilkan aturan asosiasi dari itemset ini. Algoritma ini bekerja dalam dua tahap: pertama, mencari itemset yang sering muncul (support yang tinggi), dan kedua, menghasilkan aturan asosiasi dari itemset-itemset tersebut. 2. FP-Growth (Frequent Pattern Growth) Algorithm: FPGrowth adalah algoritma asosiasi yang efisien dalam menemukan pola yang sering muncul dalam kumpulan data besar. Algoritma ini menggunakan pendekatan struktur pohon untuk menyimpan informasi tentang itemset yang sering muncul dan secara efisien menghasilkan aturan asosiasi tanpa perlu membuat kandidat itemset seperti yang dilakukan oleh algoritma Apriori. 3. Eclat Algorithm: Eclat (Equivalence Class Clustering and Bottom-Up Lattice Traversal) juga merupakan
60 algoritma populer untuk menemukan itemset yang sering muncul dalam data. Algoritma ini bekerja dengan menghitung setiap kombinasi item secara terpisah dan menggunakan pendekatan struktur lattice untuk menyimpan informasi tentang hubungan antara itemset. 4. CARMA (Classification And Regression on Minimum Association Rules) Algorithm: CARMA adalah algoritma yang menggabungkan asosiasi dan pemodelan prediktif. Algoritma ini mencoba menemukan aturan asosiasi yang memiliki pengaruh signifikan terhadap variabel target (misalnya, hasil belajar siswa) dan menggunakannya untuk membangun model prediktif. Pemilihan algoritma asosiasi yang tepat tergantung pada karakteristik data, ukuran dataset, dan tujuan analisis. Misalnya, Apriori cocok untuk dataset yang relatif kecil, sementara FP-Growth lebih efisien untuk dataset besar. Dalam konteks pembelajaran digital, algoritmaasosiasi yang dipilih harus dapat menangani volume data pembelajaran digital yang besar dan menghasilkan aturan asosiasi yang relevan untuk mendukung pengambilan keputusan dalam meningkatkan pengalaman belajar siswa.
61 C. Penggunaan Metode Asosiasi untuk Analisis Data Pembelajaran Penggunaan Metode Asosiasi untuk Analisis Data Pembelajaran memiliki beberapa manfaat dan aplikasi yang penting dalam konteks pembelajaran digital. Berikut beberapa cara di mana metode asosiasi digunakan untuk menganalisis data pembelajaran: 1. Identifikasi Pola Belajar Siswa: Metode asosiasi dapat digunakan untuk mengidentifikasi pola belajar siswa, seperti topik atau materi yang sering dipelajari bersama, urutan aktivitas pembelajaran yang umum, atau preferensi belajar siswa terhadap tipe konten atau metode pembelajaran tertentu. 2. Personalisasi Pembelajaran: Dengan memahami pola belajar siswa, metode asosiasi dapat digunakan untuk mempersonalisasi pengalaman pembelajaran untuk setiap siswa. Misalnya, platform pembelajaran digital dapat merekomendasikan materi pembelajaran tambahan atau aktivitas yang sesuai berdasarkan pola belajar siswa. 3. Peningkatan Desain Kurikulum: Analisis asosiasi dapat membantu dalam mengevaluasi efektivitas kurikulum saat ini dan mengidentifikasi area di mana penyesuaian atau perubahan mungkin diperlukan. Misalnya, jika terdapat asosiasi yang kuat antara dua topik pembelajaran, mungkin ada manfaat untuk menggabungkan atau mengintegrasikan topik tersebut dalam kurikulum.
62 4. Rekomendasi Konten: Metode asosiasi dapat digunakan untuk memberikan rekomendasi konten kepada siswa berdasarkan pola belajar mereka. Misalnya, sistem rekomendasi dapat merekomendasikan materi pembelajaran atau sumber daya tambahan yang sesuai dengan minat dan kebutuhan belajar siswa. 5. Pengelolaan Kelas dan Intervensi Dini: Analisis asosiasi dapat membantu guru atau administrator dalam mengelola kelas dengan lebih efektif. Mereka dapat menggunakan pola belajar yang teridentifikasi untuk mengelompokkan siswa, memberikan dukungan tambahan kepada siswa yang membutuhkannya, atau mengidentifikasi siswa yang mungkin memerlukan intervensi dini. 6. Evaluasi Efektivitas Pembelajaran: Dengan menganalisis asosiasi antara berbagai elemen pembelajaran dan hasil belajar siswa, metode asosiasi dapat digunakan untuk mengevaluasi efektivitas strategi pembelajaran atau program pembelajaran tertentu. Penggunaan metode asosiasi dalam analisis data pembelajaran dapat memberikan wawasan berharga kepada para pendidik dan administrator dalam meningkatkan pengalaman belajar siswa dan mencapai hasil pembelajaran yang lebih baik.
63 D. Implementasi Asosiasi dalam Platform Pembelajaran Digital Implementasi Metode Asosiasi dalam Platform Pembelajaran Digital dapat dilakukan melalui berbagai langkah dan teknik. Berikut adalah beberapa cara di mana asosiasi dapat diimplementasikan dalam platform pembelajaran digital: 1. Pengumpulan Data: Langkah pertama dalam implementasi metode asosiasi adalah mengumpulkan data pembelajaran dari platform digital. Ini mungkin termasuk data tentang interaksi siswa dengan konten pembelajaran, aktivitas pembelajaran, respons ujian atau kuis, dan informasi profil siswa. 2. Preprocessing Data: Data yang dikumpulkan kemudian perlu diproses dan dibersihkan untuk mempersiapkannya untuk analisis asosiasi. Ini mungkin melibatkan langkah-langkah seperti menghapus data yang hilang atau tidak valid, normalisasi data, dan mengubahnya ke format yang sesuai untuk analisis asosiasi. 3. Pemilihan Variabel: Setelah data diproses, langkah selanjutnya adalah memilih variabel atau atribut yang relevan untuk dianalisis. Ini bisa termasuk topik pembelajaran, tipe aktivitas pembelajaran, karakteristik siswa, atau metrik hasil pembelajaran. 4. Analisis Asosiasi: Setelah variabel yang relevan dipilih, metode asosiasi seperti Apriori atau FPGrowth dapat diterapkan untuk menemukan aturan asosiasi antara variabel-variabel ini. Algoritma-
64 asosiasi akan mengidentifikasi itemset yang sering muncul bersama dan menghasilkan aturan asosiasi yang dapat digunakan untuk memahami pola belajar siswa. 5. Visualisasi dan Interpretasi: Hasil dari analisis asosiasi dapat divisualisasikan untuk memudahkan pemahaman dan interpretasi. Grafik atau diagram dapat digunakan untuk mengilustrasikan hubungan antara variabel-variabel pembelajaran, sementara statistik deskriptif dapat digunakan untuk menggambarkan kekuatan dan signifikansi aturan asosiasi. 6. Integrasi dengan Sistem Rekomendasi: Aturan asosiasi yang dihasilkan dapat diintegrasikan ke dalam sistem rekomendasi platform pembelajaran digital. Sistem ini dapat menggunakan aturan asosiasi untuk merekomendasikan konten pembelajaran tambahan, aktivitas pembelajaran, atau sumber daya lainnya kepada siswa berdasarkan pola belajar mereka. 7. Evaluasi dan Iterasi: Proses implementasi asosiasi dalam platform pembelajaran digital harus diikuti dengan evaluasi terhadap efektivitasnya. Hal ini melibatkan memantau dampak rekomendasi yang dihasilkan oleh aturan asosiasi pada pengalaman belajar siswa dan melakukan iterasi atau penyesuaian sesuai kebutuhan. Dengan mengimplementasikan metode asosiasi dalam platform pembelajaran digital, pendidik dapat memanfaatkan data pembelajaran untuk memahami pola belajar siswa dengan lebih baik, mempersonalisasi pengalaman pembelajaran dan meningkatkan efektivitas strategi pembelajaran.
65 E. Evaluasi Hasil dan Interpretasi Pola yang Ditemukan Setelah menerapkan metode asosiasi dalam analisis data pembelajaran digital dan menemukan pola-pola yang signifikan, langkah penting berikutnya adalah evaluasi hasil dan interpretasi pola yang ditemukan. Berikut adalah beberapa langkah yang dapat diambil dalam evaluasi dan interpretasi: 1. Evaluasi Kualitas Aturan Asosiasi: Pertama-tama, perlu dievaluasi kualitas aturan asosiasi yang dihasilkan. Hal ini melibatkan pemeriksaan metrikmetrik seperti support, confidence, dan lift untuk setiap aturan asosiasi. Aturan dengan nilai support dan confidence yang tinggi serta lift yang signifikan dianggap lebih kuat dan lebih relevan. 2. Relevansi Terhadap Konteks Pembelajaran: Setiap aturan asosiasi harus dievaluasi untuk memastikan relevansinya dalam konteks pembelajaran. Pertimbangkan apakah aturan tersebut memberikan wawasan yang berharga tentang pola belajar siswa atau hubungan antara elemen-elemen pembelajaran yang relevan. 3. Korelasi vs. Kausalitas: Penting untuk diingat perbedaan antara korelasi (hubungan antara dua variabel) dan kausalitas (sebab-akibat). Meskipun aturan asosiasi dapat mengidentifikasi hubungan antara variabel, tidak selalu menunjukkan sebabakibat. Oleh karena itu, perlu hati-hati dalam menafsirkan aturan asosiasi.
66 4. Validasi dengan Pengetahuan Domain: Hasil analisis asosiasi harus divalidasi dengan pengetahuan domain atau ahli subjek dalam bidang pembelajaran yang bersangkutan. Ini membantu memastikan bahwa interpretasi pola belajar sesuai dengan prinsip-prinsip pembelajaran dan pengajaran yang relevan. 5. Visualisasi Pola: Penggunaan visualisasi, seperti grafik atau diagram, dapat membantu dalam menginterpretasikan pola-pola yang ditemukan dengan lebih baik. Visualisasi dapat memperjelas hubungan antara variabel-variabel pembelajaran dan membuatnya lebih mudah dipahami. 6. Pengambilan Keputusan: Hasil evaluasi dan interpretasi pola yang ditemukan harus digunakan untuk mendukung pengambilan keputusan yang lebih baik dalam merancang strategi pembelajaran, mengembangkan kurikulum, atau memberikan intervensi pembelajaran yang sesuai. 7. Iterasi dan Perbaikan: Proses evaluasi dan interpretasi pola harus berkelanjutan, dan temuan yang didapatkan harus digunakan untuk meningkatkan analisis selanjutnya dan melakukan perbaikan dalam praktik pembelajaran. Ini memungkinkan pendekatan yang lebih efektif dan relevan dalam meningkatkan pengalaman belajar siswa. Dengan melakukan evaluasi yang teliti dan interpretasi yang tepat terhadap pola-pola yang ditemukan dalam data pembelajaran digital, pendidik dapat memperoleh wawasan yang berharga untuk meningkatkan efektivitas pembelajaran dan memberikan dukungan yang lebih baik kepada siswa.
67 F. Faktor-Faktor yang Mempengaruhi Penemuan Pola dalam Pembelajaran Digital Penemuan pola dalam pembelajaran digital dipengaruhi oleh berbagai faktor, baik dari segi data yang digunakan maupun konteks pembelajaran itu sendiri. Berikut adalah beberapa faktor yang memengaruhi penemuan pola dalam pembelajaran digital: 1. Kualitas dan Kuantitas Data: Kualitas data yang digunakan dalam analisis sangat penting. Data yang lengkap, akurat dan representatif akan memungkinkan identifikasi pola yang lebih signifikan. Selain itu, kuantitas data juga penting untuk memastikan bahwa analisis memiliki cukup sampel untuk mendeteksi pola yang mungkin ada. 2. Konteks Pembelajaran: Konteks pembelajaran, seperti tujuan pembelajaran, metode pengajaran, struktur kurikulum dan karakteristik siswa, akan memengaruhi pola-pola yang muncul dalam data. Misalnya, pola belajar dapat berbeda antara mata pelajaran, tingkat pendidikan, atau lingkungan pembelajaran online versus offline. 3. Teknologi dan Infrastruktur: Teknologi yang digunakan untuk mengumpulkan dan menyimpan data pembelajaran serta infrastruktur jaringan yang mendukung penggunaan platform pembelajaran digital juga dapat memengaruhi penemuan pola. Teknologi yang lebih canggih dan infrastruktur yang lebih kuat
68 dapat memfasilitasi analisis yang lebih kompleks dan akurat. 4. Algoritma Analisis: Pemilihan algoritma analisis yang tepat juga memengaruhi penemuan pola. Algoritmaasosiasi seperti Apriori, FP-Growth, atau Eclat memiliki kelebihan dan kelemahan masing-masing dalam mengidentifikasi pola dalam data. Pemilihan algoritma yang sesuai dengan karakteristik data dan tujuan analisis sangat penting. 5. Preprocessing Data: Langkah pra-pemrosesan data, seperti penghapusan data yang hilang, normalisasi, atau pemfilteran, juga dapat memengaruhi penemuan pola. Preprocessing yang baik dapat meningkatkan kualitas data dan membantu algoritma-asosiasi dalam menghasilkan hasil yang lebih akurat. 6. Pengetahuan Domain: Pengetahuan domain atau pemahaman tentang konteks pembelajaran juga memainkan peran penting dalam penemuan pola. Pengetahuan ini membantu dalam memahami polapola yang ditemukan dan menafsirkannya dengan benar dalam konteks pembelajaran yang relevan. 7. Kesadaran dan Keterampilan Analisis: Tingkat kesadaran dan keterampilan analisis data dari para pengguna platform pembelajaran digital, seperti guru atau administrator, juga penting. Pelatihan dan pendidikan dalam analisis data dapat membantu meningkatkan kemampuan mereka dalam memahami dan menggunakan temuan analisis secara efektif. Dengan memperhatikan faktor-faktor ini, pembuat kebijakan, pendidik, dan administrator dapat meningkatkan efektivitas analisis data pembelajaran digital dan
69 memperoleh wawasan yang lebih mendalam untuk mendukung pengambilan keputusan yang lebih baik dalam konteks pembelajaran. G. Peran Metode Asosiasi dalam Personalisasi Pembelajaran 1. Metode Asosiasi memainkan peran penting dalam personalisasi pembelajaran dengan memberikan wawasan tentang preferensi, kebutuhan, dan pola belajar siswa secara individual. Berikut adalah beberapa peran kunci metode asosiasi dalam personalisasi pembelajaran: a. Segmentasi Siswa: Metode asosiasi dapat digunakan untuk mengidentifikasi kelompok siswa yang memiliki pola belajar serupa. Dengan memahami pola-pola ini, pendidik dapat melakukan segmentasi siswa dan menyusun kelompok-kelompok yang homogen berdasarkan preferensi belajar masing-masing. b. Rekomendasi Konten: Aturan asosiasi yang dihasilkan dari analisis data dapat digunakan untuk merekomendasikan konten pembelajaran yang sesuai dengan minat, gaya belajar, atau tingkat keterampilan siswa. Misalnya, platform pembelajaran dapat merekomendasikan materi pembelajaran tambahan atau sumber daya yang relevan berdasarkan pola belajar siswa. c. Penyesuaian Kurikulum: Analisis asosiasi dapat membantu dalam menyesuaikan kurikulum
70 untuk memenuhi kebutuhan belajar individual siswa. Dengan memahami pola belajar siswa, kurikulum dapat disesuaikan untuk memberikan pengalaman pembelajaran yang lebih relevan dan bermakna bagi setiap siswa. d. Pengaturan Aktivitas Pembelajaran: Metode asosiasi dapat membantu dalam merancang dan mengatur aktivitas pembelajaran yang sesuai dengan preferensi belajar siswa. Misalnya, aktivitas pembelajaran dapat disesuaikan dengan gaya belajar siswa yang telah diidentifikasi melalui analisis asosiasi. e. Intervensi Pembelajaran: Analisis asosiasi dapat membantu dalam mendeteksi siswa yang membutuhkan intervensi pembelajaran tambahan. Aturan asosiasi yang menunjukkan pola belajar yang kurang optimal atau kesulitan belajar dapat digunakan untuk mengidentifikasi siswa yang memerlukan dukungan tambahan. f. Pengukuran Kemajuan: Metode asosiasi juga dapat digunakan untuk mengukur kemajuan siswa secara individual. Dengan membandingkan pola belajar siswa dari waktu ke waktu, pendidik dapat mengevaluasi efektivitas strategi pembelajaran dan mengidentifikasi area di mana siswa mengalami kemajuan atau kesulitan. Melalui penggunaan metode asosiasi, personalisasi pembelajaran dapat ditingkatkan dengan memperhatikan kebutuhan, preferensi, dan karakteristik belajar siswa secara individual. Ini dapat membantu
71 meningkatkan motivasi, keterlibatan dan hasil belajar siswa secara keseluruhan. 2. Tantangan dan Hambatan dalam Penerapan Metode Asosiasi Meskipun Metode Asosiasi menawarkan banyak manfaat dalam analisis data pembelajaran, ada beberapa tantangan dan hambatan yang perlu diperhatikan dalam penerapannya: a. Volume dan Kompleksitas Data: Tantangan utama adalah volume besar dan kompleksitas data dalam konteks pembelajaran digital. Platform pembelajaran digital dapat menghasilkan jumlah data yang sangat besar dari berbagai sumber, seperti interaksi siswa, aktivitas pembelajaran, dan hasil evaluasi. Mengelola, memproses, dan menganalisis data yang kompleks ini bisa menjadi tugas yang menantang. b. Preprocessing Data: Pra-pemrosesan data merupakan langkah penting dalam analisis asosiasi, tetapi sering kali membutuhkan waktu dan upaya yang signifikan. Membersihkan data, menangani data yang hilang atau tidak valid, dan melakukan transformasi data dapat menjadi tantangan dalam konteks pembelajaran digital. c. Keterbatasan Algoritma: Meskipun ada beberapa algoritma yang digunakan untuk analisis asosiasi, seperti Apriori dan FP-Growth, setiap algoritma memiliki kelebihan dan kelemahan masingmasing. Beberapa algoritma mungkin tidak efisien dalam menangani volume data yang besar
72 atau mungkin tidak cocok untuk jenis pola yang ingin diidentifikasi. d. Interpretasi yang Tepat: Interpretasi hasil analisis asosiasi membutuhkan pemahaman yang baik tentang konteks pembelajaran dan subjek yang diuji. Tidak semua hubungan antara variabel pembelajaran bersifat kausal, dan ada risiko menarik kesimpulan yang tidak tepat dari aturan asosiasi. e. Privasi dan Etika: Penggunaan data siswa untuk analisis asosiasi memunculkan masalah privasi dan etika. Perlindungan privasi siswa harus diutamakan, dan penting untuk memastikan bahwa penggunaan data dilakukan dengan memperhatikan kebijakan privasi dan regulasi yang berlaku. f. Pengetahuan Domain: Analisis asosiasi sering kali membutuhkan pemahaman yang mendalam tentang konteks pembelajaran dan subjek yang diuji. Kurangnya pengetahuan domain atau pemahaman yang tidak memadai tentang proses pembelajaran dapat membatasi interpretasi dan penggunaan temuan analisis. g. Infrastruktur dan Sumber Daya: Penerapan metode asosiasi membutuhkan infrastruktur teknologi yang memadai dan sumber daya manusia yang terampil. Tidak semua lembaga pendidikan memiliki infrastruktur yang cukup dan keterampilan yang diperlukan untuk melakukan analisis asosiasi secara efektif.
73 Dengan memperhatikan tantangan dan hambatan ini, penting untuk merencanakan dan melaksanakan analisis asosiasi dengan hati-hati, memperhitungkan aspek teknis, etika dan praktisnya. Dengan pendekatan yang tepat, banyak dari tantangan ini dapat diatasi untuk mendapatkan wawasan yang berharga dalam pembelaja-ran digital.
74 Metode Regresi dan Prediksi Dalam Digital Learning Jihan Kristal Yasmin, S.Mat. ewasa ini, segala aspek dalam kehidupan kita sudah banyak dibantu oleh perkembangan teknologi. Termasuk juga pada perkembangan teknologi di bidang pendidikan. Perkembangan ini sudah dimulai sejak hadirnya radio dan televisi di Indonesia tahun 1960. Seiring berjalannya waktu, perkembangan teknologi pada bidang pendidikan ini tidak hanya menggunakan media radio dan televisi melainkan menggunakan media komputer. Pada tahun 2008, Kementerian Pendidikan dan Kebudayaan Republik Indonesia mengembangan Buku Sekolah Elektronik yang pada masa ini media pembelajaran tidak hanya menggunakan bahan ajar buku tetapi juga menggunakan media audiovisual melalui disk. Media ini dapat diakses menggunakan komputer dengan konten pembelajaran yang lebih interaktif. Kemudian, media audiovisual melalui disk ini dikembangkan menjadi media berbasis web yang dapat diakses menggunakan internet. Keuntungan dari media berbasis web D
75 ini ialah penggunaan lebih efisien jika dibanding dengan media sebelumnya. Hingga sampai era revolusi industri 4.0, perkembangan media pembelajaran kini sudah banyak menggunakan media mobile application. Di mana media ini sering disebut sebagai e-learning. E-learning merupakan singkatan dari elektronik learning yang definisinya adalah sebuah media pembelajaran yang menggunakan media elektronik. Namun, e-learning tidak dapat berdiri sendiri. E-learning adalah bagian dari Learning Management System atau yang biasa disebut sebagai LMS. Media LMS inilah yang menjadi cikal bakal digital learning. Di mana semua pembelajaran dilakukan secara digital menggunakan bantuan dari internet. Dengan begitu, pembelajaran di masa yang akan datang akan terasa lebih efektif dan efisien. Pada media pembelajaran e-learning ini, tentu saja kita akan menemukan banyak macam data, baik data nominal, data ordinal, data interval dan data rasio. Data-data yang tersimpan pada sistem basis data sistem e-learning ini dapat digunakan dalam proses analisis pembelajaran atau yang disebut sebagai
76 learning analytics. Menurut Long dan Siemens definisi dari learning analytics adalah sebuah pengukuran, pengumpulan, analisis, dan pelaporan data terkait siswa yang tujuannya untuk memahami dan mengoptimalkan pembelajaran (Kharis & Zili, 2022). Pada learning analytics ini, terdapat dua aspek yang menjadi fokus penelitian para peneliti dan praktisi ilmu pendidikan, diantaranya yaitu aspek pedagogis seperti kurikulum pembelajaran mandiri dan proses pembelajaran; aspek teknologi seperti data mining, teknik visualisasi data serta sistem manajemen pembelajaran (Lee et al., 2020). Dengan perkembangan teknologi media pembelajaran elearning ini, akan semakin banyak data yang dihasilkan dan sangat dibutuhkan kemampuan untuk mengolah data tersebut menjadi data yang lebih informatif dan bermanfaat. Maka dari itu, learning analytics melakukan sebuah penambangan data (data mining) pada data-data yang terdapat pada e-learning. Penambangan data atau data mining pada data pendidikan disebut sebagai Educational Data Mining (EDM). EDM ini berfokus pada pengembangan dan penerapan berbagai metode untuk mengekstrak informasi penting pada data pendidikan (Avella et al., 2016). Pada pembahasan selanjutnya, kita akan membahas mengenai definisi data mining, tujuan data mining dan beberapa metode data mining. A. Definisi Data Mining Definisi dari data mining dikutip dari laman dicoding.com adalah proses pengumpulan dan pengola-
77 han data yang bertujuan untuk mengekstrak informasi yang penting pada data. Data mining sendiri menggunakan teknik statistik, matematika, artificial intelligence dan machine learning untuk membuat dan mencari pola atau informasi pada suatu data (Yuli Mardi, 2019). Data mining ini merupakan salah satu langkah dalam knowledge discovery in database atau yang disingkat sebagai KDD. Pada proses KDD ini, ada beberapa tahap diantaranya ialah pembersihan data (data cleaning), integrasi data (data integration), pemilihan data (data selection), transformasi data (data transformation), penggalian data (data mining), evaluasi pola (pattern evaluation), dan penyajian pengetahuan (knowledge presentation) (Kharis & Zili, 2022). Kita bahas satu per satu secara rinci proses KDD ini. Gambar 1. Tahap Knowledge Discovery in Database, Doc. Pribadi. Pada pembersihan data (data cleaning) dilakukan proses menghilangkan data yang tidak relevan dan tidak konsisten. Pada data pendidikan terdapat isian yang tidak sempurna seperti data yang hilang, tidak valid, atau salah
78 ketik. Maka, untuk mencegah terjadinya bias pada hasil KKD, maka data tidak sempurna tersebut dibuang. Setelah itu, dilakukan integrasi data (data integration). Integrasi data adalah suatu proses penggabungan berbagai data dari berbagai sumber ke dalam satu basis data baru. Penggabungan data dapat dilakukan pada fitur yang sama atau menambahkan fitur sehingga didapat informasi yang lebih besar. Selanjutnya adalah seleksi data (data selection). Dari tahap penggabungan data, tidak semua data akan digunakan. Maka dari itu, pada tahap seleksi data akan menyeleksi data yang sesuai untuk dianalisis sebelum tahap penggalian informasi dimulai. Kemudian dilakukan transformasi data (data transformation) untuk menyamakan format sesuai dengan metode penggalian data yang digunakan. Terakhir, proses yang dilakukan adalah penggalian data (data mining). Metode data mining ini sangat beragam tergantung dari tujuan dan proses yang ingin dilakukan dalam KDD secara keseluruhan. Setelah data mining dilakukan, pola atau informasi hasil ekstraksi akan dievaluasi. Tujuannya adalah untuk menilai apakah pola atau informasi tersebut sudah sesuai dengan hipotesis awal atau belum. Selanjutnya adalah penyajian pengetahuan. Pola atau informasi hasil ekstraksi dari proses data mining perlu disajikan dalam bentuk yang mudah dimengerti oleh pihak yang berkepentingan.
79 B. Metode Data Mining Metode pada data mining sendiri terdiri dari empat metode diantaranya: 1. Association Pada association akan digunakan metode berbasis aturan yang digunakan untuk menemukan asosiasi dan hubungan variabel dalam satu set data. 2. Classification Pada classification akan dilakukan suatu prediksi berdasarkan kelas dari suatu objek. 3. Regression Pada regression, akan digunakan teknik untuk menjelaskan variabel dependen melalui proses analisa variabel independen. 4. Clustering Terakhir, pada clustering akan dilakukan pembagian kumpulan data menjadi beberapa kelompok berdasarkan kemiripan dari atribut data tersebut. Gambar 2. Metode Data mining. Doc. Pribadi
80 Pada bab ini, kita akan khusus membahas satu dari keempat metode data mining ini yaitu regression atau regresi. C. Definisi Regresi Seperti yang sudah dijelaskan sebelumnya, bahwa regresi adalah suatu metode yang menggunakan variabel dependen atau variabel terikat untuk memprediksi melalui proses analisa pada variabel independen atau variabel bebas. Definisi regresi linear menurut Montgomery dalam bukunya yang berjudul Introduction to Linear Regression Analysis adalah sebuah metode statistik yang memodelkan hubungan linier antara variabel terikat dan satu atau lebih variabel bebas (Khuri, 2013). Dari definisi regresi linear di atas, kita mengetahui bahwa fungsi dari metode ini adalah untuk memprediksi suatu kejadian dan/atau hal berdasarkan data yang digunakan. Metode regresi linear secara sederhana dirumuskan pada persamaan sebagai berikut: ̂ Keterangan: ̂ = pengamatan y pada periode i = parameter yang tidak diketahui = periode Metode regresi linear ini dibagi menjadi dua yaitu metode regresi linear sederhana dan metode regresi linear berganda. Jika kita sudah mengetahui bahwa metode regresi linear sederhana hanya menggunakan satu
81 variabel bebas, maka metode regresi linear berganda menggunakan dua atau lebih variabel bebas (Us[hıe & Güler, 2013). Metode regresi linear berganda dituliskan pada persamaan berikut: <(1) ̂ <(2) Dimana: ̂ = pengamatan y pada periode i = parameter yang tidak diketahui = periode Pada pembahasan bab ini, kita lebih terfokus pada penggunaan metode regresi linear untuk prediksi hasil belajar peserta didik melalui media digital learning. Tentu data yang digunakan tidaklah hanya data tunggal saja. Melainkan akan ada banyak data yang kita dapati pada platform pembelajaran digital tersebut. Maka dari itu, pada pembahasan ini saya menampilkan tiga studi kasus yang di mana terdapat bentuk data dengan satu variabel dan data dengan banyak variabel. Secara umum, tahap perhitungan menggunakan metode regresi linear ini diawali dengan pengumpulan data, pre-processing data, penerapan metode regresi linear dan validasi hasil. D. Studi Kasus 1 Terdapat 20 siswa yang pada awal pembelajaran melakukan assessment awal mengenai pemahaman materi
82 menggunakan metode pre-test. Setelah siswa diberi pembelajaran secara detail, diakhir langsung dilakukan post-test. Data hasil dari pre-test dan post-test pada 20 siswa tersebut ditampilkan pada tabel berikut: Tabel 1. Data Pre-test dan Post-test Siswa Pre-Test Post-Test 1 50 80 2 40 75 3 35 80 4 65 75 5 70 100 6 40 85 7 60 95 8 70 100 9 75 95 10 30 80 11 85 100 12 55 65 13 50 75 14 45 65 15 90 100 16 80 95 17 55 85 18 35 70
83 19 60 90 20 75 100 Dari data tersebut, ketika diolah menggunakan metode regresi linear sederhana, maka akan didapatkan hasil sebagai berikut: Dapat kita lihat bahwa koefisien intercept atau nilai dari dan nilai dari masing-masing 55,538 dan 0,514. Maka, persamaan regresi linear sederhana yang terbentuk adalah ̂ yang artinya bahwa dari 20 data hasil pre-test dan post-test di atas, prediksi rata-rata nilai yang diperoleh siswa berkisar 55,54. Regression Statistics Multiple R 0,7447041 R Square 0,5545841 Adjusted R Square 0,5298388 Standard Error 8,3904977 Observations 20 ANOVA df SS MS F Significance F Regression 1 1577,791868 1577,792 22,411672 0,000165613 Residual 18 1267,208132 70,40045 Total 19 2845 Coefficients Standard Error t Stat P-value Lower 95% Intercept 55,538671 6,601076082 8,413578 1,187E-07 41,67032491 Pre-Test 0,5143576 0,108649569 4,734097 0,0001656 0,286093303
84 E. Studi Kasus 2 Pada studi kasus 2 ini, kita akan mencari persamaan regresi linear menggunakan banyak data yang lebih banyak. Data-data tersebut disajikan pada tabel dibawah ini. Tabel 2. Data Pre-test, Tugas 1, Ulangan Harian 1, dan Post-test Siswa Pre-Test Tugas 1 UH 1 Post-Test 1 50 30 66 80 2 40 50 62 75 3 35 35 74 80 4 65 0 18 75 5 70 15 58 100 6 40 20 68 85 7 60 90 82 95 8 70 85 98 100 9 75 45 76 95 10 30 90 56 80 11 85 55 88 100 12 55 25 46 65 13 50 65 38 75 14 45 70 78 65 15 90 100 98 100 16 80 90 68 95 17 55 65 56 85 18 35 60 42 70 19 60 85 54 90 20 75 70 68 100
85 Berbeda dengan studi kasus 1, pada studi kasus 2 ini kita menggunakan data yang lebih banyak lagi, yaitu terdapat data Pre-test, Tugas 1, Ulangan Harian 1 dan Posttest. Dari data tersebut, ketika diolah menggunakan metode regresi linear berganda, maka akan didapatkan hasil sebagai berikut: Dapat kita lihat bahwa koefisien intercept atau nilai dari dan nilai dari baik pada dan masingmasing 46,89 dan 6 , 2 6 dan 2 2 9. Maka, persamaan regresi linear berganda yang diperoleh adalah ̂ 6 9 6 2 6 Regression Statistics Multiple R 0,814199704 R Square 0,662921158 Adjusted R Square 0,599718875 Standard Error 7,741888118 Observations 20 ANOVA df SS MS F Significance F Regression 3 1886,010694 628,6702 10,48888 0,000465526 Residual 16 958,989306 59,93683 Total 19 2845 Coefficients Standard Error t Stat P-value Lower 95% Intercept 46,89049615 7,19054109 6,521136 7,05E-06 31,64722999 Pre-Test 0,416183694 0,109299066 3,807752 0,001547 0,184480024 Tugas 1 0,021648845 0,070081936 0,308908 0,761378 - 0,126918222 UH 1 0,202896558 0,108735642 1,865962 0,080487 - 0,027612705
86 Siswa PreTest Tugas 1 Tugas 2 UH 1 UH 2 PTS PAS PostTest 1 50 30 45 66 60 65 70 80 2 40 50 55 62 70 85 70 75 3 35 35 65 74 60 75 80 80 4 65 0 25 18 0 75 70 75 5 70 15 35 58 30 65 80 100 6 40 20 70 68 40 90 80 85 7 60 90 55 82 60 65 85 95 8 70 85 80 98 40 70 85 100 9 75 45 45 76 50 85 85 95 10 30 90 80 56 80 80 75 80 11 85 55 75 88 70 85 80 100 12 55 25 25 46 30 65 50 65 13 50 65 35 38 70 75 55 75 14 45 70 80 78 50 90 50 65 15 90 100 95 98 100 100 100 100 16 80 90 75 68 80 85 85 95 17 55 65 0 56 70 50 80 85 18 35 60 75 42 60 85 65 70 19 60 85 75 54 70 85 85 90 20 75 70 60 68 70 80 90 100 2 2 9 yang artinya bahwa dari 20 data di atas, prediksi rata-rata nilai yang diperoleh siswa berkisar 46,89. F. Studi Kasus 3 Terakhir pada studi kasus 3, kita masih menggunakan metode regresi linear berganda namun dengan banyak data yang lebih banyak dari studi kasus 2. Pada studi kasus 3 ini pun, data yang digunakan lebih komprehensif mencakup nilai tugas, ulangan harian, penilaian tengah semester dan penilaian akhir semester. Data-data tersebut disajikan pada tabel berikut. Tabel 3. Data Pre-test, Tugas 1, Tugas 2, Ulangan Harian 1, Ulangan harian 2, PTS, PAS, dan Post-test
87 Dikarenakan data-data tersebut memiliki variabel lebih dari dua, tentu kita akan menggunakan metode regresi linear berganda untuk mencari nilai a dan b. Hasil pengolahan data tersebut dengan metode regresi linear berganda adalah sebagai berikut: Regression Statistics Multiple R 0,952024199 R Square 0,906350075 Adjusted R Square 0,851720953 Standard Error 4,711988572 Observations 20 ANOVA df SS MS F Significance F Regression 7 2578,565964 368,3666 16,59097 2,72915E-05 Residual 12 266,4340357 22,20284 Total 19 2845 Coefficients Standard Error t Stat P-value Lower 95% Intercept 40,67038217 12,51118302 3,250722 0,006947 13,4108561 Pre-Test 0,285677786 0,08877802 3,217889 0,007383 0,092247097 Tugas 1 -0,034096318 0,072847804 -0,46805 0,648136 -0,192818048 Tugas 2 0,119584357 0,116122287 1,029814 0,323408 -0,133424371 UH 1 0,04736796 0,086447681 0,547938 0,593781 -0,140985357 UH 2 0,013573047 0,086978109 0,156051 0,878587 -0,175935972 PTS -0,300208037 0,187989944 -1,59694 0,136263 -0,70980294 PAS 0,562553048 0,115614651 4,865759 0,000388 0,310650364
88 Dapat kita lihat bahwa koefisien intercept atau nilai dari adalah 40,7603 dan untuk nilai b diperoleh 2 6 9 9 2 62 . Maka dapat kita tulis persamaan regresi linear berganda dari nilai a dan b yang diperoleh ialah sebagai berikut: 6 2 6 9 9 2 62 Arti dari persamaan diatas ialah bahwa dari 20 data di atas, prediksi rata-rata nilai yang diperoleh siswa berkisar 40,76 Dari pembahasan yang telah dijelaskan, dapat kita simpulkan bahwa metode regresi ini merupakan bagian dari data mining yang bertujuan untuk memprediksi sesuatu berdasarkan data-data yang kita miliki. Metode regresi linear sendiri terdiri dari dua jenis, yaitu metode regresi linear sederhana dan metode regresi linear berganda. Gunanya, metode regresi linear sederhana itu untuk menghitung prediksi berdasarkan satu variabel terikat dan satu variabel bebas. Sedangkan yang metode regresi linear berganda itu memiliki variabel bebas yang terdiri dari dua bahkan lebih seperti pada studi kasus 2 dan studi kasus 3.