The words you are searching are inside this book. To get more targeted content, please make full-text search by clicking here.

Buku "Data Mining dalam Digital Learning" menggali konsep- konsep penting dalam pemanfaatan data mining di ranah pendidikan digital. Dari analisis pola perilaku belajar hingga prediksi keberhasilan siswa, buku ini memperkenalkan pembaca pada beragam teknik dan aplikasi data mining yang memungkinkan peningkatan efektivitas pembelajaran online. Penulis secara komprehensif membahas cara-cara untuk mengoptimalkan data yang dihasilkan dalam konteks pembelajaran digital, memberikan wawasan berharga bagi para pendidik dan praktisi di bidang teknologi pendidikan.

Discover the best professional documents and content resources in AnyFlip Document Base.
Search
Published by penamudamedia, 2024-07-01 08:35:06

Data dalam Mining Dalam Digital Learning

Buku "Data Mining dalam Digital Learning" menggali konsep- konsep penting dalam pemanfaatan data mining di ranah pendidikan digital. Dari analisis pola perilaku belajar hingga prediksi keberhasilan siswa, buku ini memperkenalkan pembaca pada beragam teknik dan aplikasi data mining yang memungkinkan peningkatan efektivitas pembelajaran online. Penulis secara komprehensif membahas cara-cara untuk mengoptimalkan data yang dihasilkan dalam konteks pembelajaran digital, memberikan wawasan berharga bagi para pendidik dan praktisi di bidang teknologi pendidikan.

Data dalam Mining Pembelajaran Digital


Data dalam Mining Pembelajaran Digital Dr. Agung Triayudi, S.Kom., M.Kom., Dr. Ilham, S.Kom, M.Kom., Ellen Tantrisna, S.Kom., M.MSI., Neny Rosmawarni, M.Kom., Jihan Kristal Yasmin, S.Mat., Ardiansyah, M.Kom., Rizqi Putri Nourma Budiarti, S.T., M.T., Endah Septa Sintiya,S.Pd.,M.Kom., Faidul Adzim, S.E., M. Si., Andi Aswani, S.Pd., M. Pd., Dr. Eko Sudarmanto, S.E., M.M.


Data Mining dalam Digital Learning Copyright© PT Penerbit Penamuda Media, 2024 Penulis: Dr. Agung Triayudi, S.Kom., M.Kom., Dr. Ilham, S.Kom, M.Kom., Ellen Tantrisna, S.Kom., M.MSI., Neny Rosmawarni, M.Kom., Jihan Kristal Yasmin, S.Mat., Ardiansyah, M.Kom., Rizqi Putri Nourma Budiarti, S.T., M.T., Endah Septa Sintiya,S.Pd.,M.Kom., Faidul Adzim, S.E., M. Si., Andi Aswani, S.Pd., M. Pd., Dr. Eko Sudarmanto, S.E., M.M. ISBN: 978-623-8586-90-5 Desain Sampul: Tim PT Penerbit Penamuda Media Tata Letak: Enbookdesign Diterbitkan Oleh PT Penerbit Penamuda Media Casa Sidoarium RT 03 Ngentak, Sidoarium Dodeam Sleman Yogyakarta HP/Whatsapp : +6285700592256 Email : [email protected] Web : www.penamuda.com Instagram : @penamudamedia Cetakan Pertama, Juni 2024 xii + 254, 15x23 cm Hak cipta dilindungi oleh undang-undang Dilarang memperbanyak sebagian atau seluruh isi buku tanpa izin Penerbit


v Kata Pengantar alam era digital yang terus berkembang, penggunaan data mining telah menjadi kunci utama dalam memahami pola-pola kompleks di balik interaksi pembelajaran online. Buku ini, "Data Mining dalam Digital Learning", tidak hanya memperkenalkan konsep-konsep dasar data mining, tetapi juga mengeksplorasi cara-cara di mana teknologi ini memperkaya pengalaman belajar secara digital. Diharapkan buku ini dapat menjadi panduan menjadi berharga bagi mereka yang ingin memahami dan mengimplementasikan data mining dalam konteks pendidikan digital, membantu menciptakan lingkungan belajar yang lebih adaptif dan efisien. D


vi Daftar Isi Kata Pengantar...................................................................................v Daftar Isi ...............................................................................................vi Bab 1. Data dalam Mining Pembelajaran Digital.................1 A. Jenis–Jenis Data Mining ......................................................4 B. Teknik Data Mining................................................................6 Bab 2. Konsep Dasar Data Mining dan Aplikasinya dalam Digital Learning .................................................25 A. Pengertian Data Mining ....................................................25 B. Kemampuan Data Mining.................................................28 C. Flow Proses Data Mining...................................................29 D. Step-Step dalam Data Mining .......................................30 E. Manfaat dari Data Mining................................................31 F. Kelebihan dari data mining antara lain: ....................31


vii G. Kekurangan Data Mining.................................................. 32 H. Tips dalam Menggunakan Data Mining ...................... 32 I. Penerapan Metode Dalam Data Mining Beserta Contohnya............................................................................... 33 J. Aplikasi Data Mining Dan Contoh Penerapannya .. 35 K. Kesimpulan ............................................................................. 37 Bab 3. Metode Klasifikasi untuk Prediksi dan Klasifikasi dalam Digital Learning ................................................. 38 A. Jenis-jenis Metode Klasifikasi.......................................... 39 B. Pemilihan Metode Klasifikasi yang Tepat ................... 42 C. Penerapan Metode Klasifikasi dalam Digital Learning................................................................................... 46 D. Tantangan dan Pertimbangan Etis dalam penggunaan Metode Klasifikasi dalam Digital Learning................................................................................... 49 E. Kesimpulan ............................................................................. 53


viii Bab 4. Metode Asosiasi dan Penemuan Pola dalam Digital Learning ...............................................................56 A. Konsep Dasar Asosiasi dalam Konteks Pembelajaran Digital...........................................................57 B. Algoritma Asosiasi yang Umum Digunakan ..............59 C. Penggunaan Metode Asosiasi untuk Analisis Data Pembelajaran .........................................................................61 D. Implementasi Asosiasi dalam Platform Pembelajaran Digital...........................................................63 E. Evaluasi Hasil dan Interpretasi Pola yang Ditemukan...............................................................................65 F. Faktor-Faktor yang Mempengaruhi Penemuan Pola dalam Pembelajaran Digital ..................................67 G. Peran Metode Asosiasi dalam Personalisasi Pembelajaran .........................................................................69 Bab 5. Metode Regresi dan Prediksi Dalam Digital Learning..............................................................................74 A. Definisi Data Mining............................................................76


ix B. Metode Data Mining ........................................................... 79 C. Definisi Regresi ...................................................................... 80 D. Studi Kasus 1......................................................................... 81 E. Studi Kasus 2......................................................................... 84 F. Studi Kasus 3......................................................................... 86 Bab 6. Analisis Text Mining dalam Data Learning ........... 89 A. Teknik Terkait Text Mining.............................................. 90 B. Tahapan Text Mining.......................................................... 93 C. Implementasi Text mining................................................ 96 Bab 7. Metode Penambangan Data Graf dalam Digital Learning.............................................................................. 98 A. Pengertian Penambangan Data Graf dalam Digital Learning ................................................................. 102 B. Manfaat Penggunaan Metode Penambangan Data Graf dalam Digital Learning......................................... 106 C. Metode Penambangan Data Graf dalam Digital Learning................................................................................ 109


x D. Implementasi Penerapan Metode Penambangan Data Graf Menggunakan Decisison Tree .................. 114 E. Implementasi Penerapan Metode Penambangan Data Graf Menggunakan Clustering Kmeans ......... 122 F. Penutup................................................................................. 134 Bab 8. Analisis Visualisasi Data dan Representasi dalam Digital Learning ............................................................ 137 A. Pengantar Visualiasi Data dan Digital Learning... 137 B. Mengapa Visualisasi Penting? ....................................... 138 C. Komponen Visualisasi Data............................................ 140 D. Jenis-jenis Visualisasi Data............................................ 141 E. Implementasi Visualisasi Data dalam Digital Learning ................................................................................ 145 Bab 9. Evaluasi dan Validasi Model Data Mining dalam Digital Learning ............................................................ 147 A. Definisi dan konsep dasar evaluasi dan validasi.... 147


xi B. Pentingnya evaluasi dan validasi dalam konteks digital learning................................................................... 149 C. Teknik Evaluasi Model Data Mining........................... 150 D. Validasi Model Data Mining .......................................... 153 E. Algoritma Data Mining yang Umum Digunakan dalam Digital Learning................................................... 158 F. Evaluasi Kinerja Model pada Data Real-Time....... 163 G. Pengaruh Kualitas Data terhadap Evaluasi dan Validasi .................................................................................. 168 H. Tool dan Software untuk Evaluasi dan Validasi Model Data Mining ........................................................... 172 I. Ethical Considerations and Bias in Model Evaluation ............................................................................ 177 J. Future Trends in Model Evaluation and Validation181 Bab 10. Penggunaan Data Mining untuk Personalisasi Pembelajaran................................................................. 186 A. Definisi Data Mining ........................................................ 187


xii B. Personalisasi Pembelajaran: Menjelaskan mengapa personalisasi pembelajaran menjadi penting dalam mencapai hasil pembelajaran yang optimal. .......... 189 C. Pengumpulan dan Persiapan Data............................. 190 D. Analisis Data untuk Personalisasi Pembelajaran... 195 E. Personalisasi Pembelajaran Berbasis Data............... 199 F. Personalisasi Pembelajaran: Menjelaskan mengapa personalisasi pembelajaran menjadi penting dalam mencapai hasil pembelajaran yang optimal. .......... 202 G. Evaluasi dan Umpan Balik............................................. 204 H. Studi Kasus dan Implementasi Praktis..................... 208 Bab 11. Etika Data Mining dalam Konteks Digial Learning........................................................................... 214 A. Pentingnya Etika Data Mining .................................... 216 B. Prinsip Etika dalam Data Mining............................... 220 Daftar Pustaka.............................................................................. 226 Tentang Penulis ............................................................................ 249


1 Data dalam Mining Pembelajaran Digital Dr. Agung Triayudi, S.Kom., M.Kom etiap momen yang terlibat dalam perjuangan perubahan di Indonesia dari masa ke masa tidak terlepas dari kerja sama generasi muda dan dewasa. Generasi dewasa mempunyai segudang pengalaman, dan generasi muda mempunyai segudang gagasan untuk masa depan. Era digital bisa menjadi peluang sekaligus kutukan jika Anda tidak siap menghadapi perubahan. Akibat perubahan gaya hidup dan budaya masyarakat, banyak fungsi yang berpindah dari media cetak ke media digital. Setiap perubahan menimbulkan pengetahuan baru yang dapat membawa manfaat atau menimbulkan masalah. Oleh karena itu, ada beberapa hal yang perlu dipertimbangkan. Dibalik kemudahan yang ada saat ini juga terdapat permasalahan baru yang memerlukan solusi dan cara berpikir baru. Pertanyaannya adalah pentingnya mengembangkan strategi pembelajaran di era digital. Perubahan tersebut telah mengubah cara pandang dan praktik pembelajaran dalam dunia pendidikan saat ini. Perkembangan pendidikan di era digital telah memungkinkan siswa memperoleh segudang ilmu pengetahuan dengan cepat dan mudah. PerubaS


2 han pendidikan di era digital menuntut guru/instruktur untuk mampu mengintegrasikan teknologi informasi dan komunikasi ke dalam proses pembelajaran. Pendidikan merupakan proses berkelanjutan yang berlang-sung beberapa tahun untuk setiap siswa. Selama waktu tersebut, informasi pendidikan yang terkait disimpan secara teratur. Pada awal semester, misalnya, setiap siswa mengambil daftar mata pelajaran yang sudah ditentukan sesuai kurikulum yang berlaku. Kemudian, pada akhir semester, tahap evaluasi diberikan untuk setiap mata pelajaran. Pada semester berikutnya, proses ini diulang dengan rincian yang berbeda. Untuk menyimpan kegiatan tersebut, diperlukan suatu sistem database yang mampu mendukung penanganan data pendidikan, yang dikenal sebagai sistem informasi sekolah. Pembelajaran di era digital saat ini tidak lagi terfokus pada guru dan instruktur, melainkan sudah berubah. Pembelajaran saat ini harus berpusat pada siswa. Era digital merupakan era dimana segala aspek kehidupan, termasuk proses pembelajaran, sangat bergantung pada media digital. Hal ini dikarenakan pembelajaran digital memerlukan kemauan siswa dan guru untuk berkomunikasi secara interaktif menggunakan teknologi informasi dan komunikasi seperti komputer/laptop dengan internet dan smartphone dengan aplikasi. Dengan demikian, kehadiran teknologi informasi dapat dijadikan sebagai strategi pembelajaran di era digital. Tujuan dari strategi pembelajaran di era digital adalah untuk meningkatkan kualitas pembelajaran di era digital. Menurut Gartner Group, data mining adalah proses menemukan hubungan baru yang mempunyai arti, pola dan


3 kebiasaan dengan memilah-milah sebagian besardata yang disimpan dalam media penyimpanan dengan menggunakan teknologi pengenalan pola seperti teknik statistik dan matematika. Data mining merupakan gabungan dari beberapa disiplin ilmu yang menyatukan teknik dari pembelajaran mesin, pengenalan pola, statistik, database, dan visualisasi untuk penanganan permasalahan pengambilan informasi dari database yang besar Data mining menurut David Hand, Heikki Mannila, dan Padhraic Smyth dari MIT adalah analisa terhadap data (biasanya data yang berukuran besar) untuk menemukan hubungan yang jelas serta menyimpulkannya yang belum diketahui sebelumnya dengan cara terkini dipahami dan berguna bagi pemilik data tersebut. Data mining adalah proses yang menggunakan teknik statistik, matematika, kecerdasan buatan, dan machine learning untuk mengekstraksi dan mengidentifikasi informasi yang bermanfaat dan pengetahuan yang terkait dari berbagai database besar. Data mining merupakan serangkaian proses untuk menggali nilai tambah dari suatu kumpulan data berupa pengetahuan yang selama ini tidak diketahui secara manual. Tujuan data mining adalah mendapatkan hubungan atau pola yang mungkin memberikan indikasi yang bermanfaat. Data mining bukanlah suatu bidang yang sama sekali baru. Salah satu kesulitan untuk mendefinisikan data mining adalah kenyataan bahwa data mining mewarisi banyak aspek dan teknik dari bidang-bidang ilmu yang dulu sudah mapan terlebih dulu. Gambar 2 menunjukkan bahwa data mining memiliki akar yang panjang dari bidang ilmu yang berbeda seperti kecerdasan buatan (artificial intelligent), machine learning, statistik, database, dan juga information retrieval.


4 Gambar 1. bidang ilmu data mining A. Jenis–Jenis Data Mining Beberapa jenis fungsionalitas database yang dapat yang dapat dilakukan dalam pengolahan data antara lain adalah 1. Association/Asosiasi adalah kejadian terkait dengan peristiwa tunggal. Misalnya, sebuah studi dari pola pembelian supermarket mungkin mengungkapkan bahwa, ketika chip jagung dibeli, minuman cola dibeli sebanyak 65 persen dari waktu ke waktu tetapi ketika ada promosi,


5 cola dibeli sebanyak 85 persen dari waktu ke waktu . Informasi ini membantu manajer membuat keputusan yang lebih baik karena mereka telah belajar profitabili-tas promosi. 2. Sequences/Pengurutan adalah peristiwa terkait dari waktu ke waktu. Kita mungkin menemukan, misalnya, bahwa jika seseorang membeli rumah, maka kulkas baru akan dibeli dalam waktu dua minggu sebanyak 65 persen dari waktu ke waktu dan oven akan dibeli dalam waktu satu bulan dari pembelian rumah sebanyak 45 persen dari waktu ke waktu. 3. Classfication/klasifikasi Classification mengakui pola yang menggambarkan kelompok yang dimiliki oleh sebuah item dengan memeriksa item yang ada yang telah diklasifikasikan dengan menyimpul- kan seperangkat aturan. Misalnya, bisnis seperti kartu kredit atau telepon perusahaan khawatir tentang hilangnya pelanggan tetap. Klasifikasi membantu menemukan karakteristik pelanggan yang cenderung untuk pergi dan dapat memberikan model untuk membantu manajer memprediksi siapa orang pelanggan sehingga manajer dapat merancang kampanye khusus untuk mempertahankan pelanggan tersebut. 4. Clustering/segmentasi Clustering bekerja dalam cara yang mirip dengan klasifikasi ketika ada kelompok yang belum ditentukan. Sebuah alat data mining dapat menemu-


6 kan kelompok yang berbeda dalam data, seperti menemukan kelompok afinitas untuk kartu bank atau partisi database ke dalam kelompok pelanggan berdasarkan demografi dan jenis investasi pribadi. 5. Forecasting/Prediction/prediksi Forecasting menggunakan prediksi dengan cara yang berbeda. Mengguna- kan serangkaian nilai-nilai yang ada untuk meramalkan nilai-nilai lainnya yang akan terjadi. Misalnya, peramal- an mungkin menemukan pola dalam data untuk membantu manajer memperkirakan nilai masa depan dari variabel kontinu, seperti angka penjualan. B. Teknik Data Mining Penambangan data dan pembelajaran mesin memiliki tingkat tumpang tindih yang tinggi penambang data mempelajari berbagai teknik yang ditemukan dalam pembelajaran mesin yang dapat mengekstrak kumpulan data besar. Banyak orang kesulitan membedakan data mining dari pembelajaran mesin, karena banyak ahli g_ha[haa[j e_^o[hs[ m_\[a[c cfgo. Imncf[b ‚j_g\_f[- d[l[h g_mch‚ ^[h ‚e_]_l^[m[h \o[n[h‚ m_lcha ^ce[cne[h dengan penambangan data. Itu juga istilah yang digunakan untuk menggambarkan teknik yang digunakan dalam penambangan data yang mendukungnya. Penambangan data, data besar dan kecerdasan buatan semuanya memiliki hubungan yang erat.


7 Gambar 1. Data mining, big data, artificial intelligence, machine learning, deep learning Untuk mengatasi tantangan pembelajaran digital, perlu membuat rencana penyampaian pembelajaran yang dapat mendukung siswa dengan berbagai kemampuan. Skenario pembelajaran ini ditujukan untuk pembelajaran elektronik (e-learning), dengan memperhatikan kendala pelaksanaan pembelajaran, seperti batasan waktu dan batasan waktu. Rencana pelaksanaan kursus ini diawali dengan pelaksanaan kursus secara berkala. Namun pada penilaian kompetensi tahap pertama, sistem harus dirancang tidak hanya memberikan nilai tetapi juga mengklasifikasikan potensi dan kemampuan siswa. Dari pengelompokan tersebut, Anda dapat menentukan arah pembelajaran untuk kompetensi berikutnya. Untuk


8 mencapai tujuan di atas, digunakan penambangan data pendidikan (EDM), atau teknik pengelompokan. Penggunaan clustering dalam penelitian ini mempunyai dua syarat. Yang pertama adalah clustering untuk mewakili kelompok siswa yang belajar, dan yang lainnya adalah clustering untuk mengukur kinerja kelas dalam melaksanakan pembelajaran. Proses evaluasi digunakan untuk mewakili kelompok, dan proses evaluasi digunakan untuk mengukur kinerja. Proses evaluasi terlebih dahulu dilakukan untuk mendata siswa dan mengetahui potensi yang dimilikinya. Pada awal perkuliahan, langkah ini menggunakan gabungan data asal mahasiswa dan data ulangan pertama (ujian 1). Berdasarkan hasil penilaian ini diharapkan siswa dibagi ke dalam kelompok berdasarkan potensi yang dimilikinya. Pengelompokan siswa ini digunakan untuk memandu pembelajaran siswa (terapi). Pada tahap ini metode clustering yang dibutuhkan adalah metodesupervised clustering, karena pembagian kelompok belajar disesuaikan dengan kelompok tertentu dalam bentuk tingkatan. Tiap level akan menuntun siswa untuk belajar untuk mencapai kompetensi yang diharapkan dalam kurikulum. Metode clustering yang cocok untuk kegiatan ini adalah Fuzzy C-mean, Karena metode ini adalah metode clustering terarah (supervised). Semisal rencana pembelajaran akan dibagi tiga, kurang, sedang dan baik. Maka ketiga pembagian tersebut akan dijadikan centroid. Penggunaan clustering selanjutnya adalah untuk melangkah ke kompetensi kedua, yaitu saat mengukur kinerja kelas. Dalam penelitian ini kinerja kelas yang dimaksud adalah kinerja


9 siswa dalam belajar dan kinerja pengajar dalam mengajar Namun untuk kali ini yang difokuskan adalah kinerja siswa, yaitu penilaian atas tes yang kedua (2ndexam). Tes yang kedua memiliki tujuan untuk mengukur kemampuan siswa dan meninjau posisi siswa dalam kelompok. Ada beberapa keluaran yang harus ditinjau dari tes ini, yaitu: sejauh mana perubahan kelompok siswa dibandingkan dengan pengelompokan pada saat tes pertama (1stexam) serta hal-hal yang mempengaruhi pengelompokan siswa(asal sekolah, jenis sekolah, dll ). Contoh Penerapan Data Mining Pada Pembelajaran Digital : 1. Rekomendasi Materi Pembelajaran Data mining digunakan untuk menganalisis data pembelajaran mahasiswa, seperti nilai tes, aktivitas online, dan umpan balik, untuk memahami kebutuhan dan minat belajar mereka. Informasi ini kemudian digunakan untuk merekomendasikan materi pembelajaran yang sesuai dengan tingkat kemampuan dan minat mahasiswa. 2. Sistem Adaptif Sistem adaptif menggunakan data mining untuk menganalisis data pembelajaran mahasiswa dan menyesuaikan materi pembelajaran dan strategi pengajaran dengan kebutuhan dan gaya belajar mahasiswa. Sistem ini dapat memberikan pengalaman belajar yang lebih personal dan efektif bagi mahasiswa.


10 3. Deteksi Dini Kesulitan Belajar Data mining digunakan untuk menganalisis data pembelajaran mahasiswa untuk mengidentifikasi mahasiswa yang berisiko mengalami kesulitan belajar. Intervensi dini dapat diberikan kepada mahasiswa ini untuk membantu mereka mencapai potensinya. 4. Personalisasi Pengalaman Belajar Data mining digunakan untuk mempersonalisasi pengalaman belajar mahasiswa dengan menyesuaikan konten, kecepatan, dan urutan pembelajaran dengan kebutuhan dan gaya belajar mereka. Hal ini dapat membantu meningkatkan motivasi belajar dan hasil belajar mahasiswa. Data mining adalah alat yang ampuh yang dapat digunakan untuk meningkatkan pembelajaran digital. Data mining dapat membantu meningkatkan personalisasi pembelajaran, meningkatkan prestasi belajar, meningkatkan efisiensi pengajaran, meningkatkan motivasi belajar, dan membuat keputusan yang lebih baik. Algoritma yang digunakan dalam data mining tergantung pada tujuan dan metode yang digunakan. Berikut adalah beberapa algoritma yang umum digunakan dalam data mining : 1. C 4.5 Pohon Keputusan (Decision Tree) merupakan metode klasifikasi dan prediksi yang sangat kuat dan terkenal. Metode pohon keputusan mengubah fakta yang sangat besar menjadi pohon keputusan yang merepresentasikan aturan. Aturan dapat dengan


11 mudah dipahami dengan bahasa alami. Aturan ini juga dapat diekspresikan dalam bentuk bahasa basis data seperti SQL untuk mencari record pada kategori tertentu. Pohon keputusan juga berguna untuk mengeksplorasi data, menemukan hubungan tersembunyi antara sejumlah calon variabel input dengan sebuah variabel target. Karena pohon keputusan memadukan antara eksplorasi data dan pemodelan, pohon keputusan ini sangat bagus sebagai langkah awal dalam proses pemodelan bahkan ketika dijadikan sebagai model akhir dari beberapa teknik lain(J R Quinlan, 1993). 2. K-Means K-means merupakan salah satu metode clustering non hirarki yang berusaha mempartisi data yang ada ke dalam bentuk satu atau lebih cluster. Metode ini mempartisi data ke dalam cluster sehingga data yang memiliki karakteristik yang sama dikelompokkan ke dalam satu cluster yang sama dan data yang mempunyai karateristik yang berbeda di kelompokan ke dalam cluster yang lain. Rumus dalam algoritma Kmeans Clustering sebagai berikut : Keterangan : D = Jarak N1 = Nama pertama C1 = Centroid AT1 = Atribut pertama AT9 = Atribut terakhir


12 Langkah-langkah dari metode K-Means adalah sebagi berikut : a. Menentukan jumlah cluster yang ingin dibuat. b. Menentukan centroid dari data angka atribut. c. Kemudian menentukan jarak data dari centroid. d. Lalu mengelompokan data sesuai clusternya dalam jarak terdekat e. Kembali ke iterasi jika posisi centroid baru dengan centroid lama, tidak sama, jika sama proses perhitungan bisa dihentikan. 3. Support Vector Machines SVM adalah metode machine learning yang bekerja atas prinsip Structural Risk Minimization (SRM) dengan tujuan menemukan hyperplane terbaik yang memisahkan dua buah class pada input space. SVM merupakan sistem pembelajaran yang menggunakan ruang hipotesis berupa fungsi-fungsi linier dalam sebuah ruang fitur (feature space) berdimensi tinggi, dilatih dengan algoritma pembelajaran yang didasarkan pada teori optimasi dengan mengimplementasikan learning bias yang berasal dari teori pembelajaran statistik. 4. Apriori Algoritma apriori adalah sebuah algoritma pencarian pola yang sangat populer dalam teknik penambangan data (datamining). Algoritma ini ditujukan untuk mencari kombinasi item-set yang mempunyai suatu nilai keseringan tertentu sesuai kriteria atau filter yang diinginkan. Hasil dari


13 algoritma ini dapat digunakan untuk membantu dalam pengambilan keputusan pihak manajemen. 5. Expectation Maximisation Algorithm Expectation Maximisation Algorithm (EM Algorithm) adalah algoritma yang sering digunakan untuk menemukan nilai estimasi Maximum Likelihood (ML) dari parameter dalam sebuah model probabilistic, dimana model juga tergantung pada latent variabel yang belum diketahui. Dalam algoritma ini, ada dua hal yang dilakukan secara bergantian yaitu E step yang menghitung nilai ekspektasi dari likelihood termasuk laten variabel seolah-olah seperti mereka ada, dan M step menghitung nilai estimasi ML dari parameter dengan memaksimalkan nilai ekspektasi dari likelihood yang ditemukan pada E step. 6. PageRank PageRank adalah sebuah algoritma yang telah dipatenkan yang berfungsi menentukan situs web mana yang lebih penting/populer. PageRank merupakan salah satu fitur utama mesin pencari Google dan diciptakan oleh pendirinya, Larry Page dan Sergey Brin yang merupakan mahasiswa Ph.D. Universitas Stanford. 7. k-Nearest Neighbors K-Nearest Neighbor (KNN) adalah suatu metode yang menggunakan algoritmasupervised dimana hasil dari query instance yang baru diklasifikan berdasarkan mayoritas dari kategori pada KNN.


14 Tujuan dari algoritma ini adalah mengklasifikasikan obyek baru bedasarkan atribut dan training sample. Algoritma metode KNN sangatlah sederhana, bekerja berdasarkan jarak terpendek dariquery instance ke training sample untuk menentukan KNN-nya. Training samplediproyeksikan ke ruang berdimensi banyak, dimana masing-masing dimensi merepresentasikan fitur dari data. Ruang ini dibagi menjadi bagian-bagian berdasarkan klasifikasi training sample. 8. N[ıp_ B[s_m Naïve Bayes merupakan pengklasifikasian dengan metode probabilitas dan statistik yang dikemukakan oleh ilmuwan Inggris Thomas Bayes, yaitu memprediksi peluang di masa depan berdasarkan pengalaman di masa sebelumnya sehingga dikenal sebagai teorema Bayes. Teorema tersebut dikombih[mce[h ^_ha[h ‛h[cp_‛ ^cg[h[ ^c[mogmce[h eih^cmc antar atribut saling bebas [1]. Pada sebuah dataset, setiap baris/dokumen I diasumsikan sebagai vector dari nilai-nilai atribut <r1,r2,<,r3> ^cg[h[ nc[j hcf[cnilai menjadi peninjauan atribut Xi (iЄ[1,n])). 9. Cf[mmcfi][ncih [h^ R_al_mmcih Tl__m CART (Classification And Regression Trees) yaitu metode pohon regresi dan pohon klasifikasi. Jika variabel dependen yang dimiliki bertipe kategorik maka CART menghasilkan pohon klasifikasi (classification trees), sedangkan jika variabel dependen yang dimiliki bertipe kontinu atau numerik maka CART menghasilkan pohon regresi (regression trees).


15 10. Adaboost Model standard dari algoritma adaboost terdiri dari dua bagian, yaitu bagian offline training dan bagian online recognizing. Bagian offline training adalah bagian proses pelatihan data yang tidak bekerja secara realtime. Bagian ini meliputi penginputan sampel gambar positif dan sampel gambar negatif, preprocessing, pelatihan data oleh algoritma adaboost sampai membangun detektor. Setelah detektor terbentuk kita bisa melakukan pendeteksian secara realtime/online recognizing terhadap data pengujian. Sebelum melakukan pendeteksian dengan algoritma adaboost, terlebih dahulu data pengujian sudah harus mengalami preprocessing. Data mining dapat dikelompokkan menjadi beberapa kelompok, sesuai tugas yang dapat dilakukan yaitu: 1. Deskripsi Data mining digunakan dalam mencari metode sederhana untuk penggambaran pola dan kecenderungan yang terdapat pada data. Deskripsi dari pola dan kecenderungan akan memberikan kemungkinan penjelasan untuk suatu pola atau kecenderungan. 2. Estimasi Hampir sama dengan klasifikasi, variabel target padaestimasi lebih cenderung ke arah numerik dibandingkan kearah kategori. Untuk pembangunan model digunakan rekorlengkap yang menyediakan nilai dari variabel targetsebagai nilai prediksi. Kemudian pada peninjauanseterusnya, estimasi nilai


16 dari variabel target dilakukanberdasarkan nilai variabel prediksi. 3. Prediksi Memiliki kemiripan dengan klasifikasi dan estimasi,prediksi dapat meramalkan nilai dari hasil yang akan adadi masa mendatang. Terdapat beberapa metode serta 7 teknik yang digunakan dalam klasifikasi dan estimasi yang dapat digunakan untuk keadaan yang tepat untuk prediksi. 4. Klasifikasi Target variabel kategori dijabarkan dalam klasifikasi. Di antara model-model yang telah dikembangkan adalah: a. Pohon keputusan b. Pengklasifikasi bayes/naïve bayes c. Neural network d. Analisis statistik e. Algoritma genetik f. Rough sets g. Pengklasifikasi k-nearest neighbour h. Metode berbasis aturan i. Memory based reasoning j. Support vector machine Perbedaan antara pembelajaran digital dan pembelajaran tradisional dalam data mining : Perbedaan antara pembelajaran digital dan pembelajaran tradisional dalam data mining adalah pada bagian pengumpulan dan pengolahan data. Pembelajaran digital menggunakan teknologi informasi dan komunikasi


17 (TIC) untuk mengumpulkan, mengolah, dan menganalisis data yang besar dan kompleks. Hal ini memungkinkan data mining terhadap prestasi yang lebih baik, seperti lebih cepat dan mudah untuk menemukan pola dan relasi antar data secara otomatis. Pada pembelajaran tradisional, data dapat disimpan dalam bentuk analog, seperti kartu kuning atau dokumen, yang membutuhkan waktu dan tenaga untuk pengolahan. Hal ini membuat pembelajaran tradisional lebih efektif untuk data yang relatif kecil dan tidak kompleks Selain itu, pembelajaran digital dan pembelajaran tradisional juga berbeda dalam tingkat interaktivitas. Pembelajaran digital menggunakan teknologi digital untuk mempermudah interaktivitas antara pembelajar dan pengajar, seperti video konferensi, chat, dan forums online. Pada pembelajaran tradisional, interaktivitas antara pembelajar dan pengajar lebih terbatas, seperti pada kelas tradisional di sekolah atau universitas. Hal ini membuat pembelajaran tradisional lebih efektif untuk mengembangkan kemampuan interpersonal dan komunikasi yang lebih baik. Selain itu, pembelajaran digital juga memungkinkan pembelajar untuk memiliki kontrol lebih besar atas pendekatan belajar, seperti memilih materi yang diinginkan dan mengakses materi yang lebih lengkap. Penerapan data mining di dunia pendidikan masih dalam tahap awal dan perlu mendapat perhatian lebih. Proses penggunaan EDM dan LA untuk meningkatkan kualitas pengambilan keputusan telah menjadi tantangan bagi institusi pendidikan tinggi pada hari ini. Penelitian–


18 penelitian mengenai learning analytics dan EDM di Indonesia masih sedikit. Padahal data Pendidikan diIndonesia terus bertambah seiring bertambahnya kegiatan akademik dan non akademik khususnya pada masa pandemi ini. Berlimpahnya data pendidikan di Indonesia berpotensi untuk digali sehingg menghasilkan pola–pola baru dari data yang bermanfaat untuk efektivitas proses pembelajaran. Hal ini membuka peluang diterapkannya learning analytics dan EDM untuk pengelolaan pendidikan yang lebih baik dan efektif. Sudah saatnya perkembangan teknologi yang terjadi digunakan untuk menganalisis data pendidikan sehingga keputusan dan kebijakan yang diambil oleh institusi lebih terbuka dan berdasarkan data yang ada. Penggunaan learning analytics dan educational data mining yang sudah ada perlu dipaparkan sehingga dapat memberikan gambaran penggunaan data pendidikan untuk pengambilan keputusan dan pencegahan kegagalan peserta didik pada proses pembelajaran. Proses analisis dari data–data yang diambil dari institusi pendidikan menggunakan teknik data mining untuk menghasilkan informasi yang berguna baik dalam penelitian maupun praktik–praktik dalam bidang pendidikan dikenal sebagai educational data mining. Pesatnya penggunaan teknologi dalam pendidikan membuat data pendidikan tersedia begitu banyak sehingga Educational Data Mining (EDM) mampu menyediakan sejumlah besar informasi yang relevan dan gambaran yang lebih jelas tentang peserta didik dan proses belajarnya.


19 EDM menggunakan berbagai macam data mulai dari intelligence computer tutor, classic computer-based educational systems,kelas online, data–data akademik yang ada di institusi pendidikan, dan data ujian yang terstandarkan. Data tersebut dianalisis menggunakan teknik Data Mining (DM) untuk memecahkan masalah pendidikan Sama halnya dengan teknik ekstraksi DM lainnya, proses pada EDM juga mengekstraksi hal–hal yang menarik, dapat ditafsirkan, dan bermanfaat dari data pendidikan. Hasil ekstraksi ini kemudian digunakan untuk menambah pengetahuan tentang fenomena pendidikan, siswa, dan sejumlah pengaturan agar proses belajar dan mengajar dapat berlangsung secara optimal. Dengan mengembangkan pendekatan komputasi yang menggabungkan data dan teori diyakini dapat membantu meningkatkan kualitas proses belajar mengajar. Dari sudut pandang praktis, EDM memungkinkan pengguna untuk mengekstrak pengetahuan dari data siswa. Pengetahuan ini dapat digunakan dalam cara yang berbeda seperti untuk memvalidasi dan mengevaluasi sistem pendidikan, meningkatkan kualitas proses pembelajaran, dan meletakkan landasan atau kurikulum bagi proses pembelajaran yang lebih efektif menyesuaikan dengan kebutuhan dan kemampuan siswa. Ide serupa telah diterapkan dengan sukses terutama dalam bisnis data pada bidang yang berbeda,seperti pada sistem ecommerce untuk meningkatkan keuntungan penjualan karena menyesuaikan dengan kebutuhan dan kemampuan konsumen atau target pasarnya. Dengan demikian, keberhasilan penerapan teknik data mining mendorong penerapannya di berbagai domain


20 pengetahuan lainnya. Contoh lebih khususnya lagi adalah data mining telah diterapkan kedata pendidikan untuk tujuan penelitian seperti meningkatkan proses belajar dan membimbing siswa untuk belajar atau memperoleh pemahaman yang lebih mendalam sesuai dengan pola belajar dan kemampuan siswa tersebut. Walaupun EDM membuat kemajuan yang relatif lebih sedikit jika dibandingkan penerapan data mining pada bidang lain namun hal ini tetap dirasa berguna dalam dunia pendidikan. Banyak tugas atau masalah dalam lingkungan pendidikan yang telah dikelola atau diselesaikan melalui EDM. Baker menyarankan empat bidang utama aplikasi EDM, yaitu meningkatkan model pembelajaran siswa, meningkatkan model domain atau bahan ajar, mempelajari dukungan pedagogis yang disediakan oleh perangkat lunak pembelajaran, dan melakukan penelitian ilmiah tentang pembelajaran dan peserta didik. Lima pendekatan /metode yang tersedia yaitu: prediksi, pengelompokan, melihat hubungan atau korelasi, penngolahan data untuk menilai kualitas siswanya, dan penemuan metode belajar baru dari model yang dibentuk. Sementara Castro mengelompokkan tugas EDM menjadi empat bidang yang berbeda, yaitu aplikasi yang berhubungan dengan penilaian kinerja belajar siswa, adaptasi kursus atau subjek dan rekomendasi pembelajaran untuk menyesuaikan pembelajaran siswa berdasarkan perilaku individu siswa, mengembangkan metode untuk mengevaluasi materi dalam kursus online, pendekatan yang menggunakan umpan balik dari siswa dan guru dalam kursus e-learning,


21 dan model deteksi untuk mengungkap perilaku belajar siswa(Castro, 2007). Analisis belajar, data mining pendidikan, dan analisis akademis merupakan konsep yang saling berkaitan erat. Data mining pendidikan berfokus pada pengembangan dan penerapan metode dengan tujuan mempromosikan penemuan dari data dalam pengaturan pendidikan. Data mining mengkaji pola dalam satu set data yang besar terkait dengan tindakan mahasiswa. Metode dapat digunakan untuk membentuk pemahaman yang lebih baik dari pengaturan pendidikan dan peserta didik. Hung, Hsu, dan Beras mendefinisikan data mining sebagai teknik analisis data yang penerapannya untuk mengekstrak pengetahuan tersembunyi dari sekumpulan data besar untuk menemukan suatu pola-pola untuk membangun model prediksi. Romero dan Ventura (2010) mendefinisikan data mining pendidikan adalah pemanfaatan algoritma data mining dengan tujuan memecahkan permasalahan yang ada di dalam dunia pendidikan. Analisis akademik mengacu pada penerapan prinsip-prinsip dan alat-alat intelijen bisnis untuk para akademisi dengan tujuan meningkatkan kualitas pengambilan keputusan terhadap kinerja lembaga pendidikan. Analisis akademik merupakan penggabungan dari set big data, teknik statistik, dan pemodelan prediktif. Pada institusi pendidikan tepatnya di Universitas, tidak luput dalam kegiatan mencari jawaban dari permasalahan yang dihadapi khususnya peminatan mahasiswa tingkat akhir dalam memilih mata kuliah


22 pilihan yang diminati. Peminatan mata kuliah pilihan pada akhir perkuliahan memungkinkan mahasiswa untuk dapat mengembangkan kemampuan dirinya serta dapat mempelajari secara mendalam mata kuliah tertentu yang sesuai dengan minat dan keahlian masing-masing agar dapat membawa ilmu yang sudah dipelajari untuk digunakan sebaik mungkin. Akan banyak kendala dalam hal menentukan minat mata kuliah pilihan yang sesuai dengan kriteria, apalagi beberapa mahasiswa hanya mengikuti pilihan mahasiswa lain dalam menentukan mata kuliah tersebut dan juga kurangnya percaya diri dengan kemampuan yang dimiliki oleh mahasiswa akhir memungkinkan tidak tercapainya tujuan yang diharapkan. Pembelajaran yang biasa ditawarkan di tingkat perguruan tinggi atau disebut mata kuliah pilihan saat ini sudah beragam tergantung kampus dan jurusannya. Salah satu Universitas bahkan sudah mempersiapkan mata kuliah pilihan yang akan diambil oleh mahasiswa pada kampus tersebut sesuai dengan kelompok bidangnya untuk diambil pada semester tertentu (dalam hal ini adalah semester akhir). Menganalisis peminatan mata kuliah pada mahasiswa tingkat akhir untuk mendapatkan hasil berupa mata kuliah pilihan apa saja yang diminati dan kurang diminati oleh mahasiswa tingkat akhir menggunakan pendekatan analisis data mining dan metode Algoritma C4.5. Hasil yang didapat pada penelitian ini diharapkan dapat menjadi acuan oleh Universitas dalam mengembangkan mata kuliah yang edukatif maupun informatif agar dapat menarik minat mahasiswa dalam mempelajari mata kuliah tersebut.


23 Tahap pengolahan data mentah ini masuk kedalam tahap praproses. Dimana tahap ini digunakan untuk mengubah data mentah sebelumnya menjadi format yang telah ditentukan dan dibutuhkan dalam proses data mining. Tahap ini juga termasuk kedalam proses penggabungan data dari berbagai sumber menjadi hingga menjadi satu, penghapusan noise dan data duplikat, dan pemilihan atribut yang dibutuhkan dan relevan. Dengan penerapan data mining, kita dapat melakukan beberapa hal diantaranya pengklasifikasian, memprediksi, memperkirakan dan mendapatkan informasi lain yang bermanfaat dari kumpulan data dalam jumlah yang besar. Klasifikasi yang ada dalam data mining dapat dilakukan dengan menggunakan algoritma C4.5. Dengan algoritma C4.5, akan didapatkan sebuah pohon keputusan yang mudah dipahami dan mudah dimengerti. Berikut merupakan karakteristik dari data mining sebagai berikut 1) Data mining nantinya akan berhubungan dengan penemuan sesuatu yang tersembunyi dengan pola data tertentu yang belum diketahui sebelumnya. Data mining biasa menggunakan ukuran data yang sangat besar. Biasanya data yang besar tersebut digunakan untuk membuat hasil dapat lebih dipercaya. 3) Data mining juga berguna untuk membuat keputusan yang kritis, terutama dalam hal pembuatan atau penentuan strategi. Selanjutnya Klasifikasi data merupakan sebuah proses yang digunakan untuk menemukan properti yang sama pada sebuah himpunan obyek yang ada di dalam


24 sebuah basis data dan dapat mengklasifikasikannya ke dalam kelas-kelas yang berbeda sesuai model klasifikasi yang sudah ditetapkan sebelumnya. Tujuan dari klasifikasi ini adalah untuk menemukan model dari training set yang dapat membedakan atribut ke dalam kategori ataupun kelas yang sesuai, nantinya model tersebut kemudian digunakan untuk mengklasifikasikan atribut yang kelasnya belum pernah diketahui sebelumnya. Teknik klasifikasi terbagi menjadi beberapa macam salah satunya adalah Pohon Keputusan. Pohon Keputusan (Decision Tree) merupakan suatu metode klasifikasi dan juga prediksi. Metode pohon keputusan nantinya mengubah fakta yang ada menjadi sebuah pohon keputusan yang akan merepresentasikan aturan. Pohon keputusan juga berguna dalam mengeksplorasi data, menemukan hubungan antara sejumlah variabel yang diinputkan dengan sebuah variabel target. Karena sebuah pohon keputusan akan memadukan antara eksplorasi data dan pemodelan, pohon keputusan akan menjadi langkah awal dalam proses pemodelan bahkan ketika dijadikan sebagai model akhir. Metode dalam data mining yang akan digunakan dalam pembentukan pohon keputusan adalah metode Algoritma C4.5. Algoritma C4.5 diharapkan akan membentuk pohon keputusan dimulai dariatas (akar) lalu ke bawah (akhir), dimana atribut paling atas ialah akar atau disebut node yang akan mewakili atribut danyang bawah dinamakan daun yang digunakan untuk mewakili kelas. Algoritma C4.5 membutuhkan suatu perhitungan yang disebut sebagai Nila iEntropy dan nilai Gain.


25 Konsep Dasar Data Mining dan Aplikasinya dalam Digital Learning Dr. Ilham, S.Kom, M.Kom A. Pengertian Data Mining 1. Apa itu Data Mining? Data mining adalah proses penggalian informasi atau pola dari data besar untuk mengidentifikasi hubungan atau kecenderungan tertentu. Data mining melibatkan penggunaan teknologi dan algoritma untuk mengekstrak data yang berguna dari database besar dan kompleks. Tujuan dari data mining adalah untuk menemukan pola atau informasi yang berguna dari data yang ada. Memasuki era digital saat ini, tidak dapat dipungkiri bahwa terjadi peningkatan yang sangat besar pada jumlah data dan informasi yang disimpan pada media elektronik. Berbagai proses penyimpanan data terse-but ditampung dalam sebuah teknologi yang dinamakan database.


26 Teknologi ini sangat menunjang proses penyimpanan sejumlah data bahkan dalam ukuran yang sangat besar. Namun, hal ini tidak hanya memberikan dampak positif sebab resiko yang dihasil-kan pula cukup drastic. Salah satu hal yang ditakutkan adalah apabila terjadi persoalan ledakan data, oleh sebab terlalu banyaknya data yang tersimpan. Perlu dipahami bahwa pada prinsipnya data memang perlu disimpan namun lebih penting lagi untuk memahami proses dari data yang disimpan tersebut terutama mengenai proses knowledge discoveryatau penemuan data. Data yang telah disimpan dalam gudang data atau data warehousesangat perlu untuk dianalisa dan diteliti. Sebuahpemahaman singkat mengenai hal ini adalah ketika seorang pebisnis membutuhkan informasi yang dapat digunakan untuk menunjang operasi-operasi bisnis yang dilakukan-nya bahkan informasi yang dapat membantunya mengambil sebuah keputusan. Hal ini tidak da-pat dilakukan dengan mengambil seluruh data tanpa memilah atau menganalisisnya, sebab sistem manajemen basis data atau database dapat saja memberikan akses terhadap data yang dib-utuhkan namun tidak semua data tersebut berguna Dari Pandangan para ahli Data Mining adalah proses yang menggunakan teknik statistik, matematika, kecerdasan buatan, machine learning untuk mengekstrak-si dan mengidentifikasi informasi yang


27 bermanfaat dan pengetahuan yang terkait dari berbagai database besar (Turban dkk. 2005). Terdapat beberapa istilah lain yang memiliki makna sama dengan data mining, yaitu Knowledge discovery in databases (KDD), ekstraksi pengetahuan (knowledge extraction), Analisa data/pola (data/pattern analysis), kecerdasan bisnis (business intelligence) dan data archaeology dan data dredging. (Larose, 2005). Data mining adalah suatu istilah yang digunakan untuk menguraikan penemuan pengetahuan di dalam database. Data mining adalah proses yang menggunakan teknik statistik, matematika, kecerdasan buatan, dan machine learning untuk mengekstraksi dan mengidentifikasi informasi yang bermanfaat dan pengetahuan yang terkait dari berbagai database besar. (Turban, dkk. 2005). 2. Perspektif Umum Data mining adalah sofrware yang digunakan untuk menemukan pola pola tersembunyi maupun hubungan-hubungan yang terdapai dalam database yang besar dan menghasilkan aturan-aturan yang di gunakan untuk memperkirakun pcrilaku di masa medatang. Data mining sering dikatakan berurusan ^_ha[h ‚j_h_go[h j_ha_n[bo[h‛ ^[f[g ^[n[\[m_. 3. Bagaimana Cara Kerja Data Mining? Data mining melibatkan beberapa tahapan, yaitu: a. Pemilihan dan pengumpulan data yang akan dianalisis.


28 b. Pembersihan dan pemrosesan data untuk menghapus data yang tidak berguna atau duplikat. c. Transformasi data untuk memperbaiki kualitas data. d. Pemodelan data yang melibatkan penggunaan algoritma tertentu untuk mengidentifikasi pola atau informasi yang berguna dari data. e. Evaluasi dan interpretasi hasil untuk menentukan apakah pola atau informasi yang ditemukan berguna atau tida B. Kemampuan Data Mining 1. Prediction Merupakan proses untuk menemukan pola dari data dengan menggunakan beberapa variabel untuk memprediksikan variabel lain yang tidak diketahui jenis atau nilainya. 2. Description Merupakan proses untuk menemukan suatu karakteristik penting dari data dalam suatu basis data. 3. Classification Klasifikasi merupakan suatu proses untuk menemukan model atau fungsi untuk menggambarkan class atau konsep dari suatu data. Proses yang digunakan untuk mendeskripsikan data yang penting serta dapat meramalkan kecenderungan data pada masa depan.


29 4. Association Proses ini digunakan untuk menemukan suatu hubungan yang terdapat pada nilai atribut dari sekumpulan data. C. Flow Proses Data Mining 1. Prediksi Prediksi memiliki kemiripan dengan klasifikasi, akan tetapi data diklasifikasikan berdasarkan perilaku atau nilai yang diperkirakan pada masa yang akan datang. 2. Deskripsi Deskripsi bertujuan untuk mengidentifikasi pola yang muncul secara berulang pada suatu data dan mengubah pola tersebut menjadi aturan dan kriteria yang dapat mudah dimengerti oleh para ahli pada domain aplikasinya. 3. Estimasi Estimasi hampir sama dengan prediksi, kecuali variabel target estimasi lebih ke arah numerik dari pada ke arah kategori. Model dibangun menggunakan record lengkap yang menyediakan nilai dari variabel target sebagai nilai prediksi. 4. Klasifikasi Klasifikasi merupakan proses menemukan sebuah model atau fungsi yang mendeskripsikan dan membedakan data ke dalam kelas-kelas.


30 5. Clustering Clustering merupakan pengelompokan data tanpa berdasarkan kelas data tertentu ke dalam kelas objek yang sama. 6. Asosiasi Tugas asosiasi dalam data mining adalah menemukan atribut yang muncul dalam suatu waktu. Dalam dunia bisnis lebih umum disebut analisis keranjang belanja (market basket analisys). Tugas asosiasi berusaha untuk mengungkap aturan untuk mengukur hubungan antara dua atau lebih atribut. D. Step-Step dalam Data Mining 1. Data selection Pemilihan (seleksi) data dari sekumpulan data operasional perlu dilakukan sebelum tahap penggalian informasi dalam KDD dimulai. 2. Pre-processing atau Cleaning Sebelum proses data mining dapat dilaksanakan, perlu dilakukan proses cleaning pada data yang menjadi fokus KDD. 3. Transformation Coding adalah proses transformasi pada data yang telah dipilih, sehingga data tersebut sesuai untuk proses data mining.


31 4. Data mining Data mining adalah proses mencari pola atau informasi menarik dalam data terpilih dengan menggunakan teknik atau metode tertentu. 5. Interpretation dan Evalution Pola informasi yang dihasilkan dari proses data mining perlu ditampilkan dalam bentuk yang mudah dimengerti oleh pihak yang berkepentingan. Tahap ini merupakan bagian dari proses KDD yang disebut interpretation. E. Manfaat dari Data Mining Data mining dapat membantu organisasi atau perusahaan dalam mengambil keputusan berdasarkan data yang tersedia. Manfaat dari data mining antara lain: 1. Menemukan pola dan informasi yang tersembunyi dari data besar yang tidak dapat diidentifikasi dengan metode manual. 2. Menghemat waktu dan biaya dalam pengambilan keputusan. 3. Meningkatkan efisiensi dalam proses bisnis F. Kelebihan dari data mining antara lain: 1. Meningkatkan efisiensi dalam pengambilan keputusan. 2. Menghemat waktu dan biaya dalam proses bisnis.


32 3. Meningkatkan akurasi dan kecepatan dalam pengambilan keputusan G. Kekurangan Data Mining 1. Memerlukan sumber daya yang besar untuk mengumpulkan, menyimpan, dan memproses data. 2. Memerlukan keterampilan dan pengetahuan yang tinggi dalam pengolahan data dan penggunaan algoritma. 3. Dapat menghasilkan kesalahan atau prediksi yang salah jika data yang digunakan tidak akurat H. Tips dalam Menggunakan Data Mining Berikut adalah beberapa tips dalam menggunakan data mining: 1. Gunakan sumber daya yang memadai untuk mengumpulkan, menyimpan, dan memproses data. 2. Pelajari dan pahami algoritma yang digunakan dalam data mining dan machine learning. 3. Pastikan data yang digunakan akurat dan tidak mengandung kesalahan. 4. Jangan mengandalkan sepenuhnya pada hasil dari data mining dan machine learning. 5. Evaluasi hasil secara berkala untuk memastikan efektivitas dari penggunaan data mining dan machine learning


33 I. Penerapan Metode Dalam Data Mining Beserta Contohnya Anda dapat menggunakan berbagai metode untuk menambang data dalam penerapan ilmu data yang berbeda. Berikut beberapa metode yang digunakan untuk melakukan data mining : 1. Association Association digunakan untuk mengidentifikasi hubungan antar elemen data atau setiap data yang ada. Data yang digunakan bisa merupakan data yang sudah ada atau data yang ada saat ini. Association digunakan untuk mengukur hubungan seberapa sering elemen terkait muncul dalam kumpulan data ^_ha[h j_lhs[n[[h ‚c` [n[o nb_h‛. Contohnya sepperti mengidentifikasi produk yang terjual untuk memahami kebiasaan konsumsi pelangan. Dengan informasi yang dihasilkan, perusahaan dapat mengembangkan strategi penjualan yang lebih baik. 2. Clustering Clustering digunakan untuk mengelompokkan kumpulan data yang memiliki karakteristik tertentu. Contohnya seperti pengelompokan hierarki, k-means, dan mode campuran Gaussian. Metode ini digunakan untuk mengetahui kelompok-kelompok tertentu dan mengelompokkan pelanggan berdasarkan tingkat kemiripannya.


34 3. Classification Metode ini paling umum digunakan dalam data mining. Classification adalah metode untuk menetapkan elemen dalam kumpulan data ke kategori yang berbeda. Beberapa contoh metode classification adalah pohon keputusan, regresi logistik, dan Nive Bayes classsifiers. 4. Regression Metode ini bertujuan untuk mencari pola nilai numerik melalui proses analisis variabel independen. Metode ini menghasilkan fungsi sebagai penentu yang didasarkan pada nilai dari input. Contohnya yaitu prediksi penjualan suatu produk ini dapat digunakan untuk menentukan harga produk berdasarkan faktor seperti pendapatan rata-rata pelanggan dan juga permintaan pelanggan. 5. Prediction Metode ini dikatakan sangat penting karena digunakan untuk memprediksi hasil yang akan dicapai di masa yang akan mendatang. Prediksi tersebut dapat diambil dengan mengetahui pola khusus dari data yang digunakan. Pola ini dapat ditemukan di beberapa variabel dalam data. Ketika pola sudah ditemukan, nantinya pola tersebut dipakai untuk memperkirakan variabel lain. Nilainya masih belum diketahui sehingga disebut sebagai fungsi prediktif. Dengan metode ini, Anda dapat memprediksi kira-kira berapa pelanggan yang akan melakukan pembelian di bulan depan berdasarkan data pembelian bulan lalu.


35 6. Tracking Patterns Metode ini digunakan untuk melacak pola atau urutan peristiwa. Fungsinya yaitu untuk menemukan suatu pola dari serangkaian kejadian atau sequence yang berurutan. Tracking patterns dapat mendeteksi sesuatu pada interval tertentu. Contohnya yaitu mendeteksi permintaan produk tertentu yang melonjak pada weekend, atau jumlah orang yang mengunjungi situs web Anda saat event tertentu. J. Aplikasi Data Mining Dan Contoh Penerapannya Setelah mengetahui pengertian dan metode data mining, selanjutnya mari kita bahas contoh penerapan data mining untuk beberapa hal. Berikut contoh penerapan data mining yang dipraktekkan organisasi dan perusahaan di beberapa industri : 1. Hiburan Platform hiburan seperti layanan streaming melakukan data mining untuk menganalisis karakteristik penggunanya. Contohnya yaitu YouTube dan Spotify yang menganalisis apa tontonan atau lagu yang relevan untuk penggunanya berdasarkan history video dan lagu mereka. Nantinya, data tersebut dapat digunakan untuk membuat rekomendasi kepada pengguna yang dipersonalisasi berdasarkan kebiasaan mereka dalam menonton video atau mendengarkan lagu.


36 2. Bisnis Perusahaan menggunakan data mining untuk mengembangkan strategi pemasaran, menganalisis pasar dan kebutuhan pelanggan. Hal tersebut dilakukan untuk mengembangkan bisnisnya. Untuk menganalisis pasar, data mining diunakan untuk mengidentifikasi karakteristik dan perilaku pelanggan. Dengan itu, pemasar dapat merencanakan strategi yang sesuai untuk meningkatkan penjualan. Selain itu, data mining juga digunakan untuk mengidentifikasi produk yang menarik untuk pelanggan dan juga memprediksi sesuatu yang dapat dilakukan untuk menarik pelanggan baru. 3. Keuangan atau Perbankan Industri keuangan atau bank menggunakan data mining untuk mendeteksi transaksi penipuan, memeriksa aplikasi pinjaman dan kredit, memprediksi risiko keuangan dan kemungkinan nasabah tidak dapat melunasi pinjaman. Data mining dilakukan untuk meminimalisir risiko kerugian yang akan dialami dan juga mengidentifikasi potensial dari pelanggan yang ada. 4. Kesehatan Selain keuangan, data mining juga dapat digunakan di industri kesehatan seperti rumah sakit. Dokter dapat menggunakan data mining untuk mendiagnosis penyakit atau kondisi medis pasien, dan juga menganalisis hasil tes darah ataupun X-ray, serta keperluan medis lainnya. Dalam penelitian medis,


37 data mining bergantung pada machine learning, penambangan data, dan bentuk analitik lainnya. K. Kesimpulan Dengan adanya data mining dapat menggunakan beberapa metode tersebut untuk menemukan pola unik dari data besar yang ada pada database. Data mining adalah salah satu hal yang perlu dipahami perusahaan untuk mengembangkan bisnisnya berdasarkan data. Ada beberapa metode yang dapat digunakan untuk mengklasifikan data secara praktis. Hal ini dapat lebih memudahkan dan fleksibel dalam melakukan berbagai pengolahan data dengan data mining.


38 Metode Klasifikasi untuk Prediksi dan Klasifikasi dalam Digital Learning Ellen Tantrisna, S.Kom., M.MSI. unia pendidikan telah mengalami transformasi signifikan selama era digital, termasuk dalam pembelajaran digital (digital learning). Dengan kemajuan teknologi saat ini, memungkinkan kita untuk mengumpulkan data tentang peserta didik dan proses pembelajarannya. Analisis data dan pengambilan keputusan yang berbasis data telah menjadi cara baru untuk meningkatkan proses pembelajaran. Salah satu teknik analisis data yang paling penting dalam digital learning adalah metode klasifikasi. Klasifikasi adalah proses pengelompokan data ke dalam kategori tertentu berdasarkan karakteristiknya. Metode klasifikasi memainkan peran penting dalam digital learning, memungkinkan prediksi dan klasifikasi data yang berkaitan dengan pembelajaran dan peserta didik. Bab ini membahas berbagai metode klasifikasi yang umum digunakan dalam digital learning. Tujuan dari bab ini D


Click to View FlipBook Version