139 Selanjutnya drag data Deals ke bagian Process, sehingga terlihat seperti Gambar 2. Gambar 2. Tampilan Layar Membaca Data Deals b. Membaca Data Deals Testset Pada implementasi Rapidminer, selain membutuhkan data latih, kita juga membutuhkan data uji. Data uji yang digunakan adalah data Deals-Testset yang berada di folder Samples > data> Deals-Testset. Drag data Deals-Testset ke bagian Process, seperti terlihat pada Gambar 3. Gambar 3. Tampilan Layar Membaca Data Deals-Testset c. Menggunakan Algoritma Naïve Bayes Langkah berikutnya adalah memilih algoritma yang digunakan, yaitu Naïve Bayes. Pada bagian
140 operator ketikkan Naïve Bayes, kemudian drag operator Naïve Bayes ke bagian Process, sehingga hasil yang didapatkan seperti Gambar 4. Gambar 4. Tampilan Layar Operator Naïve Bayes d. Apply Model Langkah berikutnya membuat model, caranya adalah dengan mengetikkan kata Apply Model pada bagian operator, kemudian drag Apply Model ke bagian Process, seperti Gambar 5. Gambar 5. Tampilan Layar Operator Apply Model
141 e. Performance Selanjutnya menambahkan operator Performance untuk mengukur kinerja model. Caranya ketikkan Performance pada bagian operator. Pilih Performance (Classification) karena kita akan melakukan klasifikasi. Anda dapat menggunakan operator Performance yang lain sesuai kebutuhan. Gambar 6 menyajikan hasil penambahan operator Performance pada bagian Process. Gambar 6. Tampilan Layar Operator Performance Sampai tahap ini desain kita telah lengkap, langkah selanjutnya adalah menghubungkan setiap operator menggunakan garis. Tarik garis dan hubungkanlah seperti terlihat pada Gambar 7.
142 Gambar 7. Tampian Layar Menambahkan Garis Hubung f. Eksekusi Untuk mengeksekusi desain yang telah kita buat, maka kliklah tombol Pada Gambar 8. disajikan tangkapan layar sebagian dari data yang dihasilkan. Gambar 8. Tampilan Layar Sebagian Data
143 Pada Gambar 9 disajikan nilai kinerja model yang didapatkan, diantaranya nilai: akurasi, presisi, dan recall. Gambar 9. Tampilan Layar Kinerja Model 2. Implementasi Rapidminer menggunakan data latih dan data uji dalam 1 file. Untuk implementasi Rapidminer menggunakan data latih dan data uji yang tersimpan dalam 1 file, kita dapat menggunakan data Iris. Langkah-langkah pengerjaan sebagai berikut: a. Membaca Data Iris Langkah pertama adalah membaca data Iris, yang terdapat pada folder Samples> data> Iris, seperti terlihat pada Gambar 10.
144 Gambar 10. Tampilan Layar Membaca Data Iris b. Operator Split Data Operator Split Data digunakan untuk membagi data Iris menjadi kelompok data latih dan data uji. Pada Gambar 11 disajikan tampilan penambahan operator Split Data. Gambar 11. Tampilan Layar Operator Split Data Saat melakukan pembagian data, tentukan juga rasio perbandingan data latih dan data uji, misalnya 50%:50%, 60%:40%, 70%:30%, 80%:20%, atau 90%:10%. Cara menentukannya adalah: double klik pada kotak Split Data, kemudian klik tombol Add Entry, kemudian masukkan angka perbandingan yang diinginkan.
145 Misalkan 70%:30%, maka kita inputkan 0.7 dan 0.3. Pada Gambar 12 disajikan penambahan rasio 0.7. Gambar 12. Tampilan Layar Add Entry Rasio 0.7 Selanjutnya klik kembali tombol Add Entry untuk memasukkan rasio 0.3. Pada Gambar 13 disajikan proses penambahan rasio 0.3. Gambar 13. Tampilan Layar Add Entry Rasio 0.3 Perhatikan bagian sisi kanan layar, terdapat pengaturan Parameter, seperti terlihat pada Gambar 14. Pada bagian Parameter kita dapat mengedit rasio atau partisi data dengan mengklik tombol Edit Enumeration.
146 Gambar 14. Tampilan Layar Parameter Setelah menentukan rasio data, selanjutnya lakukan pemilihan tipe sampling. Caranya dengan mengklik kotak Split Data, kemudian memilih salah satu tipe sampling berikut: linear, shuffled, stratified atau automatic sampling. Kita dapat juga menentukan tipe sampling melalui Parameter, sepeti yang ditunjukkan Gambar 14. c. Menggunakan Algoritma Naïve Bayes Langkah berikutnya menambahkan operator Naïve Bayes. Pada bagian operator ketikkan Naïve Bayes kemudian drag ke bagian Process, sehingga hasil yang didapatkan seperti Gambar 15. Gambar 15. Tampilan Layar Operator Naïve Bayes
147 d. Apply Model Selanjutnya menambahkan operator Apply Model, pada bagian operator ketikkan Apply Model, kemudian drag Apply Model ke bagian Process, sehingga didapatkan hasil seperti Gambar 16. Gambar 16. Tampilan Layar Operator Apply Model e. Performance Selanjutnya tambahkan operator Performance. Untuk data Iris ini kita pilih Performance (Classification) karena kita akan melakukan klasifikasi. Gambar 17 menyajikan hasil penambahan operator Performance. Gambar 17. Tampilan Layar Operator Performance
148 Setelah desain lengkap, langkah selanjutnya adalah menghubungkan bagian-bagian tersebut menggunakan garis. Tariklah garis sehingga terlihat seperti Gambar 18. Gambar 18. Tampian Layar Proses Lengkap g. Eksekusi Untuk mendapatkan hasil, kliklah tombol eksekusi Tangkapan layar tabel data yang dihasilkan disajikan pada Gambar 19. Gambar 19. Tampian Layar Tabel Data Pada Gambar 20. disajikan nilai akurasi yang dihasilkan oleh algoritma Naïve Bayes. Tipe sampling
149 yang dipilih adalah shuffled. Anda dapat berlatih dan mencoba tipe sampling yang lain. Gambar 20. Tampian Layar Performance
150
151
152 Pohon keputusan, juga dikenal sebagai Decision Tree, adalah metode yang kuat dan terkenal dalam klasifikasi dan prediksi. Metode ini merubah dataset yang besar menjadi struktur pohon keputusan yang mewakili aturan. Pedoman ini dapat dengan mudah dimengerti dengan menggunakan bahasa alami dan dapat diungkapkan dalam bentuk bahasa basisdata seperti Structure Query Language (SQL). Decision Tree adalah struktur berbentuk flow-chart yang menyerupai pohon, di mana setiap node internal adalah representasi dari pengujian pada satu atribut. Setiap cabang dari node mewakili hasil pengujian, sementara leaf node menunjukkan kelas atau distribusi kelas. Keunggulan dari Pohon Keputusan termasuk kecepatan pembangunan yang relatif tinggi dan kemudahan dalam memahami hasil model yang dihasilkan. Decision Tree memiliki 3 jenis node, sebagai berikut: 1. Root node, merupakan node teratas yang tidak memiliki input, dan mungkin tidak memiliki output atau memiliki lebih dari satu output. 2. Internal node, adalah node yang memiliki percabangan, Dimana terdapat satu input dan minimal dua output. Node ini dipakai untuk melakukan uji coba terhadap atribut spesifik. 3. Leaf node, adalah node akhir yang memiliki hanya satu input dan tidak memiliki output. Node ini mencerminkan hasil klasifikasi yang didapatkan setelah melalui serangkaian pengujian pada internal node.
153 Pada Gambar 1 disajikan contoh struktur pohon keputusan dari algoritma Decision Tree. Gambar 1. Struktur Pohon Keputusan Dalam pemilihan atribut sebagai root node atau internal node, kita menggunakan kriteria information gain dan gain rasio. Information gain digunakan untuk mengevaluasi seberapa efektif suatu atribut dalam memisahkan data ke dalam kelas yang berbeda. Sebelum menghitung information gain, langkah awalnya adalah menghitung entropi. Entropi adalah suatu ukuran dari tingkat ketidakpastian atau homogenitas dari distribusi kelas dalam suatu dataset. Semakin tinggi entropi, semakin merata distribusi kelas dalam data. Perhitungan information gain menggunakan rumus (1), sementara entropi dihitung menggunakan rumus (2). (1) Keterangan: S : himpunan kasus A : atribut n : Jumlah partisi atribut A
154 |Si| : Jumlah kasus pada partisi ke i |S : Jumlah kasus dalam S (2) Keterangan: S : himpunan kasus A : fitur n : Jumlah partisi S pi : Proporsi dari Si terhadap S Perhitungan gain rasio menggunakan rumus (3), sedangkan split information menggunakan rumus (4). Split information dihitung menggunakan entropi atau gini index pada distribusi nilai atribut. (3) (4) Untuk implementasi algoritma Decision Tree di Rapidminer kita menggunakan data yang telah disediakan oleh Rapidminer, yaitu: data Golf dan Golf-Testset. Masing-
155 masing berisi 14 set data. Data Golf dan Golf-Testset berisikan set data klasifikasi tentang keputusan seseorang akan bermain golf atau tidak bermain golf berdasarkan kondisi: outlook (sunny, overcast, rain), temperature atau suhu (64-88) , humidity atau kelembaban (65-96), dan wind atau angin (true atau false). Lokasi data berada pada folder Samples>data> seperti terlihat pada Gambar 2. Gambar 2. Lokasi Data Golf dan Golf-Testset Tahapan-tahapan untuk implementasi algoritma Decision Tree pada Rapidminer adalah sebagai berikut: 1. Menyiapkan Data Langkah awal adalah menyiapkan data yang akan digunakan sebagai data latih dan data uji. Kita dapat menggunakan data Golf sebagai data latih dan GolfTestset sebagai data uji, yang berada pada folder Samples>data. Klik data Golf kemudian drag ke bagian Proses, lakukan hal yang sama untuk data Golf-Testset, sehingga kita dapatkan hasil seperti Gambar 3.
156 Gambar 3. Membaca Data Golf dan Golf-Testset Kita dapat melihat isi set data Golf dan Golf-Testset dengan menarik garis ke tombol result, seperti terlihat pada Gambar 4. Setelah itu dilanjutkan mengklik tombol eksekusi . Gambar 4. Proses Eksekusi Data Melalui tombol Result kita dapat melihat set data Golf dan Golf-Testset. Klik tombol Result maka akan muncul tabel yang berisikan set data Golf dan set data Golf-Testset, seperti disajikan Gambar 5 dan Gambar 6.
157 Gambar 5. Tabel Set Data Golf Gambar 6. Tabel Set Data Golf-Testset 2. Algoritma Decision Tree Langkah berikutnya adalah menambahkan operator algoritma Decision Tree, terlebih dahulu anda dapat menghapus garis pada Gambar 4 tadi. Kemudian, pada bagian operator ketikkan Decision Tree, kemudian drag ke bagian Proses, seperti Gambar 7.
158 Gambar 7. Penambahan Operator Decision Tree Kita dapat melihat pohon keputusan atau Tree yang terbentuk dari data Golf, dengan cara menarik garis ke tombol Result, seperti pada Gambar 8, diikuti dengan mengklik tombol eksekusi . Gambar 8. Eksekusi Pohon Keputusan Data Golf
159 Pada Gambar 9 disajikan pohon keputusan yang dihasilkan untuk data Golf. Gambar 9. Pohon Keputusan Data Golf Cara membaca pohon keputusan tersebut adalah: a. Jika outlook bernilai overcast maka bermain golf. b. Jika outlook bernilai rain tetapi wind bernilai false (tidak berangin) maka bermain golf. Tetapi jika outlook bernilai rain dan wind bernilai true (ada angin) maka tidak bermain golf. c. Jika outlook bernilai sunny dan humidity > 77.500 maka tidak bermain golf. Tetapi jika outlook bernilai sunny dan humidity <= 77.500 maka bermain golf. Algoritma Decision Tree memiliki beberapa Parameter yang dapat kita pilih. Perhatikan panel Parameter pada sisi kanan layar, seperti ditunjukkan Gambar 10.
160 Gambar 10. Pemilihan Parameter Kriteria Kita dapat memilih kriteria yang kita inginkan diantara kriteria Decision Tree yang tersedia, yaitu: gain_ratio, information_gain, dan gini_index. Parameter lain yang perlu ditentukan adalah kedalaman pohon keputusan maksimal yang diinginkan (maximal depth). Kedalaman pohon keputusan ini maksudnya adalah jumlah maksimum cabang dari root node sampai ke leaf node. Selain itu tentukan juga apakah akan melakukan pruning atau tidak, dan apakah akan melakukan prepruning atau tidak. Perhatikan Gambar 11. Gambar 11. Pemilihan Parameter Pruning
161 Anda dapat mencoba mempraktekkan berbagai skenario pemilihan parameter untuk mendapatkan kinerja algoritma Decision Tree terbaik. 3. Apply Model Bagaimanakah pohon keputusan yang akan terbentuk untuk data Golf-Testset? Untuk mendapatkannya, maka kita perlu terlebih dahulu membuat model klasifikasinya, dengan cara menambahkan operator Apply Model. Anda dapat menghapus garis penghubung pada Gambar 18 terlebih dahulu, selanjutnya ketikkan Apply Model pada bagian operator, kemudian drag ke bagain Proses, seperti Gambar 12. Gambar 12. Operator Apply Model
162 4. Performance Setelah model dibuat maka kita harus menerapkan operator Performance untuk mengukur kinerja model. Pada bagian operator ketikkan kata Performance, kemudian pilih Performance(Classification). Selanjutnya drag ke bagian Proses, seperti diperlihatkan Gambar 13. Gambar 13. Operator Performance 5. Eksekusi Langkah berikutnya adalah melakukan Eksekusi dengan cara menambahkan garis hubung untuk setiap bagian operator yang telah dibuat. Hubungkan garis seperti Gambar 14. Lanjutkan dengan mengeksekusi model yang sudah dibuat dengan cara mengklik tombol .
163 Gambar 14. Eksekusi Model Kinerja model yang dihasilkan disajikan pada Gambar 15. Nilai akurasi yang dihasilkan adalah 64.29%. Gambar 15. Performance Model Untuk melihat pohon keputusan yang dihasilkan model, kita dapat menarik garis dari operator Apply Model pada tombol mod ke result, seperti ditunjukkan
164 Gambar 16. Lanjutkan eksekusi dengan cara mengklik tombol . Gambar 16. Proses Eksekusi Pohon Keputusan Model Pada Gambar 17. ditampilkan pohon keputusan model yang dihasilkan. Gambar 17. Pohon Keputusan Model Pohon keputusan yang dihasilkan model menggunakan algoritma Decision Tree dengan pohon keputusan data Golf adalah sama, hal ini kemungkinan karena jumlah datanya kecil hanya 14 data. Anda dapat mencoba untuk set data yang berjumlah besar. Perhatikan pohon keputusan dan akurasi yang dihasilkan. Selamat mencoba.
165 Albright, S.C. and Winston, W.L. (2021) Business Analytics: Data Analysis & Decision Making. 6th edn. Cengage Learning. Acer (2023) Apa itu Metode Data Mining? Ini Klasifikasi dan Contohnya!, Bisnis. Available at: https://www.acerid.com/bisnis/metode-data-miningdan-contohnya (Accessed: 14 January 2024). Amrullah, N.H. (2022) Metode Klasifikasi dalam Data Mining, Ilmu Alam dan Tekno. Available at: https://www.kompasiana.com/najahamrullah1322/62b0 08fe38350056ba000382/metode-klasifikasi-dalam-datamining (Accessed: 14 January 2024). Aprilianur, G., & Leander Hadisapu, E. (2022). Penerapan Data Mining Menggunakan Metode K-Means Clustering Untuk Analisa Penjualan Toko Myam Hijab Penajam. Jurnal JUPITER, 14(1), 161–170. Anisa, N. (2022) Mengenal Artificial Neural Network, BINUS Lecturer Article. Available at:
166 https://sis.binus.ac.id/2022/02/14/mengenal-artificialneural-network/ (Accessed: 25 January 2024). Bo^cg[h, B. [h^ Nckin[chc, Z. (2021) ‘P_l\[h^cha[h Afailcng[ Klasifikasi Data Mining untuk Penelusuran Minat Calon M[b[mcmq[ B[lo’, Nuansa Informatika, 15(2), pp. 37–52. Available at: https://doi.org/10.25134/nuansa.v15i2.4162. Bo^cg[h, I. [h^ R[g[^ch[, R. (2015) ‘P_h_l[j[h Fohamc D[n[ Mining Klasifikasi untuk Prediksi Masa Studi Mahasiswa Tepat Waktu pada Sistem Informasi Ae[^_gce P_laolo[h Tchaac’, Jurnal Jupiter, 7(1), pp. 39–50. Chisholm, A. (2013). Exploring Data with RapidMiner: Explore, Uh^_lmn[h^, [h^ Pl_j[l_ R_[f D[n[ Umcha R[jc^gch_l’m Practical Tips and Tricks. Packt Publishing Dian, S.A.V. (2023) Cara Kerja Data Mining, Data Mining for Business Intelligence. Available at: https://binus.ac.id/malang/2019/01/cara-kerja-datamining-seri-data-mining-for-business-intelligence-3/ (Accessed: 14 January 2024). F. Handayani. (n.d.). Aplikasi Data Mining Menggunakan Algoritma K-Means Clustering untuk Mengelompokkan Mahasiswa Berdasarkan Gaya Belajar. Jurnal Teknologi dan Informasi, 12(1). Feby, D., 2022. Kenali Tools Data Science Terbaik untuk Data Mining. [Online] Available at: https://dqlab.id/kenali-tools-data-scienceterbaik-untuk-data-mining
167 Faran, J., & Tamara Aldisa, R. (2023). Analisis Data Mining dalam Komparasi Average Linkage AHC dan K-Means Clustering untuk Dataset Facebook Live Sellers. Jurnal Media Informatika Budidarma, 7(4), 2041–2050. F[^g[ Rcmnc[hnc, D. [h^ Soj[lg[h (2019) ‘Kigj[l[mc Afailcng[ Kf[mc`ce[mc j[^[ D[n[ Mchcha’, PROCEEDINGS OF THE 1 st STEEEM, 1(1), pp. 148–156. Fransiska, A. (2021) Metode Data Mining Classification, Popular Articles. Available at: https://sis.binus.ac.id/2021/10/22/metode-data-miningclassification/ (Accessed: 14 January 2024). Garcia Marquez, F. P. (Ed.). (2020). Handbook of Research on Big Data Clustering and Machine Learning: IGI Global. https://doi.org/10.4018/978-1-7998-0106-1 Ginantra, N.L.W.S.R. et al. (2021) Data Mining dan Penerapan Algoritma. 1st edn, Paper Knowledge . Toward a Media History of Documents. 1st edn. Jakarta: Yayasan Kita Menulis. H_fcy[hnc Som[h[ (2022) ‘P_h_l[j[h Mi^_f Kf[mc`ce[mc M_ni^_ Naive B[y_m T_lb[^[j P_haaoh[[h Aem_m Ihn_lh_n’, Jurnal Riset Sistem Informasi dan Teknologi Informasi (JURSISTEKNI), 4(1), pp. 1–8. Available at: https://doi.org/10.52005/jursistekni.v4i1.96. Hc^[y[noff[b, M.T., Amlihc [h^ Rcy[^c, S. (2015) ‘P_h_l[j[h Algoritma Neural Network Untuk Memprediksi K_f[y[e[h C[fih Amcmn_h Dim_h’, Semesta Teknika UMY, 5(1). Available at: http://repository.umy.ac.id/bitstream/handle/123456789
168 /30148/g. bab 3.pdf?sequence=7&isallowed=y. Inmon, W.H. and Hackathorn, R.D. (1994) Using the Data Warehouse. New York: John Wiley & Sons. Inmon, W.H. (2005) Building the Data Warehouse, Fourth Edition. Wiley Publishing, Inc. Kimbal, R. and Ross, M. (2013) The Data Warehouse Toolkit. John Wiley & Sons, Inc. Klinkenberg, R., & Hofmann, M. (2014). RapidMiner: data mining use cases and business analytics applications. CRC Press. Leidiyana, H. (2011) Komparasi Algoritma Klasifikasi Data Mining dalam Penentuan Risiko Kredit Kepemilikan Kendaraan Bermotor. STMIK Nusa Mandiri Jakarta. Lil_h[., S. (2016) ‘T_ehce D[n[ Mchcha M_haaoh[e[h M_ni^_ Bayes Classifier Untuk Optimalisasi Pencarian Aplikasi P_ljomn[e[[h’, Jurnal Teknik Komputer, 4(2), pp. 17–20. M[l^_hc [h^ Som[hnc (2020) ‘PENERAPAN ALGORITMA KNEAREST NEIGHBOR DALAM KLASIFIKASIDATA HASIL PRODUKSI KELAPA SAWIT PADA KUD TIRTA KENCANA’, Riau Journal of Computer Science, 06(02). Muliono, R. (2023) Algoritma K-Nearest Neighbors (KNN): Pengertian dan Penerapan, Artikel UMA. Available at: https://lp2m.uma.ac.id/2023/02/16/algoritma-k-nearestneighbors-knn-pengertian-dan-penerapan/ (Accessed: 25 January 2024). Muslim, M.A. et al. (2019) Data Mining Algoritma C4.5 Disertai Contoh Kasus dan Penerapannya dengan Program
169 Komputer. 1st edn. Edited by E. Listiana and N. Chayani. Semar: Unnes Semarang. Marsa, A.R. et al. (2023) Konsep Sistem Informasi. Edited by D. Prasetyo. Yogyakarta: PT Penamuda Media. Miftahul Huda, M.Kom (2007) Algoritma Data Mining: Analisis Data Dengan Komputer. bisakimia. Mirkin, B. (2005). Clustering for data mining: A data recovery approach. Chapman & Hall/CRC. Mob[gg[^ Yo^bi Al^c[hni _n.[f (2021) ‘P_h_hno[h T[n[ L_n[e Produk menggunakan Algoritma FP-Growth pada Toko ATK’, Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer, 5(9), pp. 3826–3832. Mahesa Putra, S., Rendi, M., & Rusda, D. (2024). PENERAPAN ALGORITMA MENGGUNAKAN RAPIDMINER UNTUK KATEGORISASI KOMPOTENSI DASAR CPNS. JATI (Jurnal Mahasiswa Teknik Informatika), 7(5), 3323– 3328. https://doi.org/10.36040/jati.v7i5.7293 Nauval, M. (2022) Perbedaan Task Data Mining Classification, Asociation, dan Segmentation, Popular Articles. Available at: https://sis.binus.ac.id/2022/01/28/artikelperbedaan-task-data-mining-classification-asociationdan-segmentation/ (Accessed: 14 January 2024). NEXDataCenter (2021) Apa Saja Metode dalam Data Mining?, Data Center. Available at: https://www.nexdatacenter.com/id/apa-saja-metodedalam-data-mining/ (Accessed: 14 January 2024).
170 Nahjan, M. R., Heryana, N., & Voutama, A. (2023). IMPLEMENTASI RAPIDMINER DENGAN METODE CLUSTERING K-MEANS UNTUK ANALISA PENJUALAN PADA TOKO OJ CELL. Jurnal Mahasiswa Teknik Informatika, 7(1), 101–104. Paminta Rahayu, D. (2013). ANALISIS KARAKTERISTIK KELOMPOK DENGAN MENGGUNAKAN PENDEKATAN CLUSTER ENSEMBLE. Jurnal Matematika Sains Dan Teknologi, 14(1), 01–10. https://doi.org/10.33830/jmst.v14i1.305.2013 Prasetyo, V. R., Lazuardi, H., Mulyono, A. A., & Lauw, C. (2021). Penerapan Aplikasi RapidMiner Untuk Prediksi Nilai Tukar Rupiah Terhadap US Dollar Dengan Metode Linear Regression. Jurnal Nasional Teknologi Dan Sistem Informasi, 7(1), 8–17. https://doi.org/10.25077/TEKNOSI.v7i1.2021.8-17 Pradnyana GA, Agustini K. Konsep Dasar Data Mining [Internet]. [cited 2024 Feb 22]. Available from: https://pustaka.ut.ac.id/lib/wpcontent/uploads/pdfmk/MSIM4403-M1.pdf. Prastyadi Wibawa Rahayu, dkk (2024) Buku Ajar Data Mining. PT. Sonpedia Publishing Indonesia. Populix (2023) Data Mining: Pengertian, Tahapan, Contoh, dan Manfaat, Kamus Riset. Available at: https://info.populix.co/articles/data-mining-adalah/ (Accessed: 14 January 2024). Ramadhan, A.S. (2022) Decision Tree Algoritma Beserta Contohnya pada Data Mining, BINUS Lecturer Article. Available at: https://sis.binus.ac.id/2022/01/21/decision-
171 tree-algoritma-beserta-contohnya-pada-data-mining/ (Accessed: 25 January 2024). Rc[hni, H. [h^ W[bihi, R.S. (2015) ‘R_m[gjfcha Liacmnc] Regression untuk Penanganan Ketidakseimbangan Cf[mm j[^[ Pl_^cemc C[][n Si`nq[l_’, Journal of Software Engineering, 1(1), pp. 46–53. Rohman, M.A. (2023) Apa itu Logistic Regression?, Mikroekonometrika. Available at: https://sekolahstata.com/apa-itu-logistic-regression/ (Accessed: 25 January 2024). R.Pallavi Reddy (2023) Text Analytics Unleashed: Enhancing Short Text Conversations and Tackling SMS Spam with Deep Learning and Machine Learning Techniques. Archers & Elevators Publishing House. Roihan, A., Sunarya, P. A., & Rafika, A. S. (2020). Pemanfaatan Machine Learning dalam Berbagai Bidang: Review paper. IJCIT (Indonesian Journal on Computer and Information Technology), 5(1). https://doi.org/10.31294/ijcit.v5i1.7951 Rangkuti M. Mengenal Data Mining [Internet]. 2023 [cited 2024 Feb 20]. Available from: https://fikti.umsu.ac.id/mengenal-data-mining/ Sasmeeta Tripathy et.al (2023) Recent Advances in Mechanical Engineering: Select Proceedings of ICRAMERD 2022. Springer Nature. Sbcp[g Sc^bo _n.[f (2014) ‘FP Gliqnb Afailcnbg Igjf_g_hn[ncih’, International Journal of Computer Applications (0975 – 8887), 93(8).
172 Sekar Setyaningtyas, Indarmawan Nugroho, B., & Arif, Z. (2022). TINJAUAN PUSTAKA SISTEMATIS: PENERAPAN DATA MINING TEKNIK CLUSTERING ALGORITMA K-MEANS. Jurnal Teknoif Teknik Informatika Institut Teknologi Padang, 10(2), 52–61. https://doi.org/10.21063/jtif.2022.V10.2.52-61 Septiana Ananda, P., Sediono, E., & Sembiring, I. (2023). KMeans Clustering Menggunakan RapidMiner dalam Segmentasi Pelanggan dengan Evaluasi Davies Bouldin Index Untuk Menentukan Jumlah Cluster Paling Optimal. Jurnal BATIRSI, 6(2), 8–13. Sarawut Ramjam, Principles and Theories of Data Mining With RapidMiner. IGI Global Publisher of Timely Knowledge Setiawan, R., 2021. Apa itu Data Mining dan Bagaimana Metodenya?. [Online] Available at: https://www.dicoding.com/blog/apa-itudata-mining/ Saleh, H. (2014) Kelebihan dan Kekurangan Algoritma Klasifikasi Data Mining Decision Tree. Gorontalo. Salsabila, S. (2018) Data Mining: Klasifikasi. Jakarta. Simanjuntak, W.O. et al. (2023) ‘P_l\[h^cha[h Afailcng[ Logistic Regression dan Random Foret (Studi Kasus : Klasifikasi Emosi Tweet) Comparison Of Logistic Regression And Random Forest Algorithms (Case Study: Tweet Emotion Classification)’, 02(1). Available at: https://doi.org/10.26418/juara.v2i1.69682. Suripto, Rahmanita, R.N. and Kirana, A.S. (2022) Teknik preprocessing dan classification dalam data science,
173 Student Corner. Available at: https://mie.binus.ac.id/2022/08/26/teknik-preprocessing-dan-classification-dalam-data-science/ (Accessed: 14 January 2024). Susanto, F. (2020) Klasifikasi Menggunakan Algoritma Data Mining. Bandar Lampung. Sembiring, de S., Panjaitan, S., & Pakpahan, A. (2019). TESTING K-MEANS ALGORITHM USING THE RAPID MINER APPLICATION FOR DATA GROUPING. 7. Trunfio, P. (2012). Service-Oriented Distributed Knowledge Discovery (Vol. 20121229). Chapman and Hall/CRC. https://doi.org/10.1201/b12990 Tineges, R. (2023) PahamiMetode Decision Tree sebagai Algoritma Data Science, Belajar Data Science dari Rumah. Available at: https://dqlab.id/pahami-metodedecision-tree-sebagai-algoritma-data-science (Accessed: 25 January 2024). Trivusi (2022) Algoritma Random Forest: Pengertian dan Kegunaannya, Machine Learning. Available at: https://www.trivusi.web.id/2022/08/algoritma-randomforest.html (Accessed: 25 January 2024). Trivusi (2023) Decision Tree: Pengertian, Cara Kerja, Kelabihan, dan Kekurangannya, Machine Learning. Available at: https://www.trivusi.web.id/2022/06/algoritma-decisiontree.html (Accessed: 25 January 2024).
174 Andi Wijaya, S. Kom., M.Kom, Lahir pada 3 Mei 1987 di bondowoso, provinsi jawa timur. Penulis menyelesaikan pendidikan S1 di Sekolah tinggi teknologi Nurul Jadid dan S2 Teknik Informatika di Universitas Dian Nuswantoro Semarang. Penulis merupakan dosen Prodi Rekayasa Prangkat Lunak Fakutas Teknik Universitas Nurul Jadid. Bidang keilmuan Teknologi Informasi dan Komunikasi, Teknik Sistem Informasi, Pengembangan Perangkat Lunak. I Wayan Rangga Pinastawa, M.Kom Mendapatkan gelar Sarjana dan juga Magister pada bidang Komputer di program studi Teknik Informatika Universitas AMIKOM Yogyakarta. Memiliki hoby membuat dan menulis blog, Beliau saat ini berprofesi sebagai Dosen di program studi sarjana Informatika, Universitas Pembangunan Nasional Veteran Jakarta. Saat ini minat penelitian beliau di bidang Machine Learning, Data Mining, Decision Support System dan Search Engine Optimization.
175 Kharisma Wiati Gusti, S.T., M.T. Lahir di Garut, 19 Juni 1990. Penulis merupakan lulusan S1 Teknik Informatika Sekolah Tinggi Teknologi Garut (sekarang Institut Teknologi Garut). Dan S2 Informatika, konsentrasi Sistem Intelijen di Institut Teknologi Bandung. Saat ini penulis menjadi dosen Program Studi Informatika di Fakultas Ilmu Komputer UPN Veteran Jakarta. Loso Judijanto adalah peneliti yang bekerja pada lembaga penelitian IPOSS Jakarta. Penulis dilahirkan di Magetan pada tanggal 19 Januari 1971. Penulis menamatkan pendidikan Master of Statistics di the University of New South Wales, Sydney, Australia pada tahun 1998 dengan dukungan beasiswa ADCOS (Australian Development Cooperation Scholarship) dari Australia. Sebelumnya penulis menyelesaikan Magister Manajemen di Universitas Indonesia pada tahun 1995 dengan dukungan beasiswa dari Bank Internasional Indonesia. Pendidikan sarjana diselesaikan di Institut Pertanian Bogor pada Jurusan Statistika – FMIPA pada tahun 1993 dengan dukungan beasiswa dari KPSPertamina. Penulis menamatkan Pendidikan dasar hingga SMA di Maospati, Sepanjang karirnya, Penulis pernah ditugaskan untuk menjadi anggota Dewan Komisaris dan/atau Komite Audit pada beberapa perusahaan/lembaga yang bergerak di berbagai sektor antara lain pengelolaan pelabuhan laut, telekomunikasi seluler, perbankan, pengembangan infrastruktur, sekuritas, pembiayaan infrastruktur, perkebunan, pertambangan batu bara, properti dan rekreasi, dan pengelolaan dana perkebunan.
176 Penulis memiliki minat dalam riset di bidang kebijakan publik, ekonomi, keuangan, human capital, dan corporate governance. Penulis dapat dihubungi melalui e-mail di: [email protected]. Muchamad Kurniawan, S.Kom., M.Kom Penulis lahir pada tanggal 23 April 1986 di Surabaya. Pendidikan terakhir penulis adalah Magister Teknik Informatika yang diperoleh di Institut Teknologi Sepuluh November Surabaya (ITS) pada tahun 2017. Penulis aktif sebagai tim pengajar di Institut Teknologi Adhi Tama Surabaya (ITATS) dari tahun 2018 sampai dengan sekarang. Matakuliah pemrograman dasar, Kecerdasan Buatan, Data Mining, dan Deep Learning adalah matakuliah yang diampu oleh penulis. Penulis juga aktif sebagai penulis di buku Ber-ISBN m_j_lnc ‚P_l[h][ha[h M[]bch_ L_[lhcha ^_ha[h B[b[m[ Pynbih OPP‛, ‚Ah[fcmcm Cfomn_lcha: cgjf_g_hn[mc ^[h eihm_j‛, m_ln[ beberapa Book Chapter. Penulis juga aktif dalam publikasi artikel karya ilmiah yang sudah diterbitkan dengan indexing Scopus, IEEE atau Jurnal bereputasi Sinta.
177 Muhamad Risqiwahid, S.Kom biasa dipanggil Risqi, adalah seorang bocah kampung yang lahir di daerah Bali Barat atau lebih tepatnya di Kampung Ketugtug, Loloan Timur. Buku ini, Software Data Mining, merupakan buku pertamanya yang diterbitkan. Risqi memiliki ketertarikan yang besar terhadap bidang teknologi dan informasi. Sejak kecil, dia sudah menunjukkan bakat dan minat dalam mempelajari berbagai perangkat lunak dan program komputer. Minat ini terus berkembang hingga dia menempuh pendidikan di bidang Sistem Informasi dan berhasil menyelesaikan studi S1 dengan IPK yang memuaskan. Buku Software Data Mining merupakan hasil dari pengalaman dan pengetahuan yang Risqi peroleh dalam mempelajari dan menggunakan software data mining. Dia ingin berbagi pengetahuannya dengan orang lain dan membantu mereka memahami bagaimana software data mining dapat digunakan untuk menyelesaikan berbagai permasalahan dalam berbagai bidang. Risqi berharap buku ini dapat bermanfaat bagi para pembaca, baik bagi mereka yang baru mengenal software data mining maupun bagi mereka yang ingin memperdalam pengetahuannya di bidang ini. Dia juga berharap buku ini dapat menginspirasi orang lain untuk terus belajar dan mengembangkan kemampuan mereka di bidang teknologi dan informasi. "Jangan pernah berhenti belajar dan mengembangkan diri. Teruslah berinovasi dan berkarya untuk memberikan kontribusi yang positif bagi kemajuan bangsa."
178 Budianingsih adalah seorang dosen di prodi Teknik Informatika Politeknik Negeri Pontianak. Ia menyelesaikan bidang Teknik Informatika, yang dimulai dengan meraih gelar Sarjana (S1) dari Universitas Al Azhar Indonesia, dan dilanjutkan dengan studi pascasarjana (S2) di Institut Teknologi Bandung, di kelompok keahlian (KK) Informatika Sekolah Teknik Elektro dan Informatika. Sebagai penulis dan juga seorang doen, ia sering kali menyampaikan pemikiran dan penelitiannya melalui publikasi ilmiah dan artikel dan juga memberikan kontribusi yang signifikan terhadap pengembangan sumber daya manusia di bidang teknologi informasi. Iqbal Sabilirrasyad, S.S.T., M.Tr.Kom Lahir di Surabaya, Jawa Timur pada bulan Juli 1996. Penulis merupakan dosen tetap di Prodi Rekayasa Perangkat Lunak, Fakultas Sains Teknologi dan Industri – Institut Teknologi dan Sains Mandala. Mulai menjadi dosen pada tahun 2021 lulusan Magister Terapan Teknologi Informasi Komputer pada Politeknik Elektronika Negeri Surabaya tahun 2020. Penulis memiliki area of interest di bidang Artificial Intelligence, Data Science, Game Development.
179 Afifah Nurul Izzati S.Kom., M.Kom. Lulus S1 di Program Studi Sistem Informasi Fakultas Rekayasa Industri Universitas Telkom Bandung tahun 2016. Lulus S2 di Program Studi Sistem Informasi Institut Teknologi Sepuluh Nopember tahun 2019. Saat ini adalah dosen tetap Program Studi Teknik Informatika Universitas Kahuripan Kediri. Jovian Dian Pratama, S.Mat., M.Mat. Lahir di Semarang pada 28 Agustus 1997. Ia lulus S-1 dengan Predikat Cumlaude di Program Studi Matematika Fakultas Sains dan Matematika Universitas Diponegoro (UNDIP) tahun 2020 dan Lulus S-2 dengan Cumlaude dan IPK Sempurna serta Lulusan Terbaik di Program Studi Magister Matematika Fakultas Sains dan Matematika Universitas Diponegoro (UNDIP) pada tahun 2022. Ia adalah pengajar tetap Departemen Matematika Fakultas Sains dan Matematika Universitas Diponegoro Semarang sejak 2022 hingga saat ini. Bidang keahliannya yaitu Matematika Terapan khususnya pada Analisis Numerik Terapan dan Komputasi. Sebelum menjadi pengajar tetap di Departemen Matematika Fakultas Sains dan Matematika Universitas Diponegoro Semarang ia pernah menjadi asisten pengajar Departemen Matematika Universitas Diponegoro (UNDIP) untuk mata kuliah Teori Himpunan dan Relasi, Logika dan Teori Pembuktian, Kalkulus, Analisis Riil, Aljabar Linier, dan Struktur Aljabar.
180 Zuriati, S.Kom., M.Kom. Lahir di kota Duri Provinsi Riau pada 3 Juni 1970. Penulis meraih gelar S1 dari Departemen Teknik Komputer Universitas Gunadarma pada tahun 1994. Pada tahun 2012, menyelesaikan Pendidikan S2 pada Departemen Ilmu Komputer Institut Pertanian Bogor. Saat ini aktif mengajar pada Program Sarjana Terapan Program Studi Teknologi Rekayasa Internet Politeknik Negeri Lampung. Penulis dapat dihubungi melalui email: [email protected]. Sriyanto, S.Kom., M.M., Ph.D. lahir di kota Wonogiri 23 Januari 1970. Menyelesaikan pendidikan Sarjana pada tahun 1993 dan Pascasarjana tahun 1998 di Universitas Gunadarma, Jakarta. Pendidikan Doktor diselesaikan pada tahun 2021 di Universiti Teknikal Malaysia Melaka. Saat ini aktif mengajar di Institut Informatika dan Bisnis Darmajaya di kota Bandar Lampung. Mengampu matakuliah Data Mining dan Advanced Network and Cyber Security.
181 Petrus Christo, M.Kom Lahir di Jakarta 05 Mei 1974, menyelesaikan pendidikan formal terakhir dalam bidang ilmu Teknik Informatika dan Teknologi Informasi selain sudah menggeluti bidang pengajaran pendidikan tinggi lebih dari 20 tahun dalam bidang llmu Komputer , penulis saat ini bekerja sebagai praktisi di bidang Informasi Teknologi, Pemrograman dan Jaringan Komputer
182