Penerapan Metode Decision Tree Pada Algoritma C4.5
Untuk Seleksi Calon Penerima Beasiswa Mahasiswa
Application of the Decision Tree Method in the C4.5 Algorithm for
the Selection of Student Scholarship Recipients
Mochammad Rafi1), Muhammad Afif Syarifuddin2), Darmoro Winanjar
Sasmiko3), Regiana Abdilah4)
Teknik Informatika, Universitas Nusa Mandiri;
Jl. Damai No. 8, Warung Jati Barat, Jakarta 125407
1)[email protected], 2)[email protected],
3)[email protected], 4)[email protected]
Abstraksi
Mendapatakan pendidikan merupakan hak dan kewajiban bagi setiap warga negara. Pendidikan adalaha salah satu bagian
yang menjadi perhatian utama bagi pemerintah, dikarenakan kemajuan sebuah negara dilihat salah satunya berdasarkan dari
bagaimana kulaitas pendidikan warga negaranya. Tetapi masih banyak warga negara yang masih terhabat untuk mendapatkan
kesempatan pendidikan dikarenakan mempunyai tingkat penghasilan yang rendah. Oleh karena itu pemerintah memberikan
bantuan dana yaitu berupa beasiswa. Dalam penyaluran dana beasiswa masih terjadi masalah yaitu salah satunya adalah
beasiswa yang diberikan masih belum tepat sasaran, sehingga menyebebkan tidak maksimalnya pendayagunaan dana
beasiswa tersebut. Dari permasalahan diatas pada penelitian ini menggunakan metode Decision Tree Algoritma C4.5 dan
aplikasi Orange 3.30.2 sebagai alternatif untuk membatu proses penyeleksian calon penerima beasiswa.
Kata Kunci: Decision Tree Method, C4.5 Algortm, Scholarship, Selection.
Abstract
Getting an education is a right and an obligation for every citizen. Education is one part that is a major concern for the
government, because the progress of a country is seen, one of which is based on the quality of education of its citizens. But
there are still many citizens who are still prevented from getting educational opportunities because they have low income
levels. Therefore, the government provides financial assistance in the form of scholarships. In the distribution of scholarship
funds, there are still problems, one of which is that the scholarships given are still not on target, so that the utilization of the
scholarship funds is not optimal. From the problems above, this research uses the Decision Tree Algorithm C4.5 method and
the Orange 3.30.2 application as an alternative to help the process of selecting prospective scholarship recipients.
Keyword: Decision Tree Method, C4.5 Algortm, Scholarship, Selection.
1
1. Pendahuluan harapan beasiswa yang diberikan akan diterima oleh
yang pantas mendapatkan beasiswa tersebut. Salah
1.1 Latar Belakang satu metode yang kami gunakan untuk penelitian ini
Mendapatakan pendidikan merupakan hak dan adalah metode Decision Tree Algoritma C4.5.
kewajiban bagi setiap warga negara. Pendidikan Algoritma ini dapat digunakan sebagai alternatif untuk
adalaha salah satu bagian yang menjadi perhatian membatu proses penyeleksian calon penerima
utama bagi pemerintah, dikarenakan kemajuan sebuah beasiswa.
negara dilihat salah satunya berdasarkan dari 1.2 Perumusan Masalah
bagaimana kulaitas pendidikan warga negaranya. Dari latar belakang yang disampaikan diatas
Dengan ini negara mengusahakan dan dapat ditarik rumusan masalah pada penelitian adalah
menyelanggarakan satu sistem pendidikan dengan untuk memberikan solusi membangun proses
memprioritaskan anggaran negara sekurang- rekomendasi penerimaan beasiswa untuk mahasiswa
kurangnya 20% dari pendapatan negaranya untuk dengan menggunakan tiga kombinasi kategori
memenuhi kebutuhan penyelenggaraan pendidikan penilaian yang ada, serta memproses kategori tersebut
nasional sesuai dengan undang-undang UUD 1945. menggunakan algoritma C4.5. dalam menciptakan
Tetapi tidak dapat dipungkiri bahwa masih beberapa keputusan berdasarkan dataset dari basis data
banyak warga negara yang masih terhabat untuk penerima beasiswa.
mendapatkan kesempatan pendidikan dikarenakan 1.3 Tujuan Penelitian
mempunyai tingkat penghasilan yang rendah. Oleh Tujuan penelitian telah dilakukan untuk
karena itu pemerintah memberikan bantuan dana yaitu membantu pengambilan keputusan dalam proses seleksi
berupa beasiswa sesuai dengan undang-undang yang calon penerima beasiswa, dengan harapan agar
tercantum dalam UU No. 20 tahun 2003 tentang sistem beasiswa dapat diberikan kepada mahasiswa yang
pendidikan nasional khususnya pasa 12 ayat 1 butir c memang pantas mendapatkannya atau tepat sasaran,
dan d, dimana yang berhak memperoleh beasiswa bagi serta dapat memberikan efisiensi waktu dalam proses
yang berprestasi, yang orang tuanya tidak mampu pengambilan keputusan pada universitas.
untuk membiayai pendidikan. 1.4 Manfaat Penelitian
Dalam penyaluran dana beasiswa masih terjadi Dengan adanya penelitian ini diharapkan dapat
masalah yaitu salah satunya adalah beasiswa yang memberikan manfaat bagi perguruan tinggi untuk
diberikan masih belum tepat sasaran, sehingga melakukan penyeleksian calon penerima beasiswa
menyebebkan tidak maksimalnya pendayagunaan dengan menggunakan metode algoritma C4.5 dan dapat
dana beasiswa tersebut. Kemudian selain itu adalah menjadi referensi bagi pengembang ilmu dalam
proses seleksi penerimaan calon beasiswa terkadang melakukan klasifikasi data.
masih dilakukan secara manual sehingga proses 1.5 Ruang Lingkup Penelitian
seleksi membutuhkan waktu yang lama dan menjadi Adapun ruang lingkup untuk penelitian ini
tidak efisien. adalah melakukan klasifikasi status diterima atau
Dari permasalahan diatas sehingga kami ditolak dan mengetahui hasil akurasi klasifikasi yang
melakuakan beberapa penelitian untuk membantu telah dilakukan pada penerimaan calon beasiswa
dalam pengambilan keputsan dalam proses mahasiswa dengan metode decision tree algoritma
penyeleksian calon penerima beasiswa, dengan C4.5.
2. Tinjauan Pustaka 6. Sequence Analysis Fungsi Sequence Analysis
2.1 Data Mining adalah mencari pola urutan dari rangkaian acara.
Data Mining adalah suatu proses analisis 7. Deviation Analysis Fungsi Deviation Analysis
database yang besar secara semiotomatis untuk adalah menemukan fakta langka tapi sangat
menemuakan suatu pola yang valid, baru, berguna dan berbeda dari keadaan normal (kejadian tidak
dapat dipahami manusia (Asmira, 2019). normal).
Oleh karena itu, "Data mining" adalah istilah 2.2 Klasifikasi
umum yang digunakan untuk menggambarkan berbagai Klasifikasi adalah proses menemukan
aspek pengolahan data. Di zaman modern, hampir sekumpulan model/fungsi yang mendeskripsikan dan
semua sistem otomatis menghasilkan beberapa bentuk membedakan data ke dalam kelas-kelas tertentu,
data untuk tujuan diagnostik atau analisis. Ini telah dengan tujuan penggunaan model tersebut untuk
menghasilkan banjir data, yang telah terjadi mencapai mengidentifikasi kelas dari suatu objek yang kelasnya
urutan petabytes atau exabytes. tidak diketahui. Terdapat dua proses klasifikasi antara
Beberapa contoh berbagai jenis data seperti lain: proses pembelajaran/pelatihan yaitu membangun
jumlah dokumen pada website, interaksi keuangan, model dengan menggunakan data latih, dimana setiap
interaksi pengguna yang menghasilkan data begitu record pada data latih dianalisis berdasarkan nilai
besar, teknologi sensor dan Internet Of Thing yang saat atribut, perhitungannya menggunakan algoritma C4.5
ini sudah banyak digunakan. untuk mendapatkan model. Kemudian proses pengujian
Data Mining memiliki banyak fungsi yang adalah menguji data uji menggunakan model yang
digunakan. Fungsi data mining dapat digabungkan diperoleh dari pelatihan (Handayani et al., 2019).
dalam beberapa kasus untuk menjawab permasalahan 2.3 Decision Tree
yang ada. Berikut ini adalah Fungsi penambangan data Decision tree atau pohon keputusan adalah
umum: struktur diagram alur seperti pohon di mana setiap
1. Classification adalah untuk mengkategorikan target simpul dalam mewakili pengujian pada atribut, setiap
kelas dalam kategori yang dipilih. cabang mewakili hasil pengujian, dan simpul daun
2. Clustering adalah untuk menemukan grup atribut mewakili kelas atau distribusi kelas (Yunial et al., n.d.).
ke dalam segmentasi segmentasi berdasarkan 2.4 Algoritma C4.5
similaritas. Algoritma C4.5 adalah algoritma yang
3. Association Fungsi dari Association adalah digunakan untuk membuat pohon keputusan. Pohon
menemukan hubungan antara atribut atau set item, keputusan adalah metode klasifikasi dan prediksi yang
berdasarkan jumlah item penampilan dan sangat efisien dan terkenal. Metode pohon keputusan
Association aturan yang ada. mengubah data yang sangat besar menjadi pohon
4. Regression Fungsi Regression hampir mirip keputusan yang mewakili aturan. Aturan dapat dengan
dengan peringkat. Fungsi dari Regresi bertujuan mudah dipahami dalam bahasa alami. Dan mereka juga
untuk menemukan prediksi model yang ada. dapat diekspresikan sebagai bahasa database seperti
5. Forecasting Fungsi Forecasting adalah melihat Structured Query Language untuk menemukan record
masa depan berdasarkan trend yang terjadi di dalam kategori tertentu(Asmira, 2019).
waktu sebelumnya.
3. Metode Penelitian Tanggungan, Status.
3.4 Metode Data Mining Usulan
Metode yang diusulkan untuk seleksi
penerimaan beasiswa mahasiswa pada penelitian ini
adalah Decision Tree Algoritma C4.5 dengan
menggunakan aplikasi orange 3.30.2 untuk melakukan
pengujian dan analisa model.
3.5 Pengujian Data
Setelah metode data sudah ditentukan kemudian
kita melakukan pengujian dengan sample data
beasiswa PPA. Data sample yang digunakan terdiri dari
atribut NIM, Nama, IPK, Pendapatan Orang Tua,
Jumlah Tanggungan dan Status. Sebanyak 90% data
akan digunakan sebagai data training dan sebanyak
10% data akan digunakan sebagai data uji atau data
testing.
Gambar 1 Metode Penelitian 3.6 Evaluasi dan Validasi Model
Evaluasi diperlukan untuk menganalisa dan
3.1 Studi Pustaka mengukur sejauh mana keakuratan hasil yang telah
Yaitu melakukan studi pustaka dengan dicapai oleh model dengan menggunakan teknik atau
mengumpulkan teori, data dan informasi dari berbagai tools yang terdapat pada aplikasi orange yaitu
sumber seperti buku-buku referensi, artikel ilmiah, Confusion Matrix. Confusion Matrix adalah tool yang
serta situs di internet yang dapat membmantu digunakan untuk evaluasi model klasifikasi untuk
memperoleh pengetahuan dan pokok permasalahan memperkirakan objek yang benar atau salah.
yang berkaitan dengan materi penulisan ini. Sedangkan untuk validasi model digunakan teknik Split
Validation yaitu teknik validasi yang membagi data
3.2 Pengumpulan Data menjadi dua bagian secara acak, sebagian sebagai data
Pada tahap ini yaitu melakukan pengumpulan Penerapan Metode Decision Tree Algoritma C4.5 untuk
data-data yang akan digunakan untuk penelitian ini. Seleksi Calon Penerima Beasiswa Mahasiswa.
Data-data yang digunakan yaitu data beasiswa
Peningkatan Prestasi Akademik (PPA). 4. Algoritma Yang Digunakan
3.3 Pengelolaan Data Awal Pada penelitian ini algoritma yang digunakan
Data yang sudah didapatkan, kemudian adalah C4.5. telah dilakukan pengujian dengan
menggunakan aplikasi orange pada data beasiswa PPA
dilakukan pengolahan data yaitu pertama melakukan sebanyak 117 orang, atribut yang di gunakan NIM,
klasifikasi data. didapatkan atribut yang akan dipakai Nama Mahasiswa, IPK, Penghasilan Orang Tua,
dalam pengujian antara lain NIM, Nama Mahasiswa, Tanggungan Orang Tua, Status. Kemudian dibuat
Indeks Prestasi (IPK), Penghasilan Orang Tua, Jumlah
klasifikasi pada atribut nilai IPK, Penghasolan Orang 5. Kesimpulan & Saran
tua dan Jumlah Tangunga sebagai berikut : 5.1 Kesimpulan
Tabel 1. Klasifikasi Nilai IPK Berdasarkan Penenlitian yang telah dilakukan
maka dapat disimpulkan bahwa:
No Nilai IPK Klasifikasi 1. Dengan adanya nilai akurasi yang bagus
1 ≥ 3,6 Sangat Baik menjadikan metode Decision Tree Algoritma
2 ≥ 3,2 Baik C4.5 dapat digunakan sebagai alternatif
pendukung dalam proses seleksi penerimaan
3 ≤ 3,2 Cukup beasiswa mahasiswa.
2. Faktor tertinggi yang mempengaruhi dalam
Tabel 2. Klasifikasi Penghasilan Orang Tua
No Pengasilan Orang Tua Klasifikasi pengambilan keputusan yaitu adalah Indeks
1 ≥ 3.500.000 Sangat Tinggi Prestasi Akademik (IPK), kemudian faktor kedua
2 ≥ 2.500.000 Tinggi Penghasilan Orang Tua dan Jumlah Tanggungan
3 ≥ 1.500.000 Sedang faktor ketiga.
5.2 Saran
4 < 1.500.000 Sedikit
Dari kesmpulan yang disebutkan penulis
Tabel 3. Klasifikasi Jumlah Tanggungan memberikan saran bahwa penelitian ini dapat
No Jumlah Tanggungan Klasifikasi integrasikan ke dalam sebuah sistem penerimaan calon
1 1-2 Sedikit mahasiswa. Sekaligus dapat dikembangkan lagi
2 3-4 Sedang dengan membuat aplikasi pengambilan keputusan agar
3 ≥5 Banyak penerimaan calon beasiswa menjadi lebih efektif dan
pengujian efisien.
Kemudian dilakukan data
menggunakan aplikasi orange dengan teknik validasi Daftar Pustaka
Cross Validation. Dari hasil pengujian didapatkan nilai Asmira. (2019). Penerapan Data Mining untuk
akurasi sebesar 84,5%. Kemudian pada pengujian ini Mengklasifikasi Pola Nasabah Menggunakan
dihasilkan rata-rata nilai Precision sebesar 82,5% dan Algoritma C4.5 pada Bank Bri Unit
Anduonohu Kendari.
rata-rata nilai Recall Sebesar 84.5%. dan didapatkan rule
yang terbentuk dari pohon keputusan dapat dilihat pada Handayani, I. (2019). PENERAPAN ALGORITMA
C4.5 UNTUK KLASIFIKASI PENYAKIT DISK
gambar 2. HERNIA DAN SPONDYLOLISTHESIS
DALAM KOLUMNA VERTEBRALIS.
HARIMURTI, F. A. (2017). KLASIFIKASI
PENERIMAAN BEASISWA MENGGUNAKAN
METODE NAÏVE BAYES CLASSIFIER
(STUDI KASUS UNIVERSITAS TRUNOJOYO
MADURA).
Hasmin, E., & Hasmin, E. (2019). Penerapan
Algoritma C4.5 Untuk Penentuan Penerima
Beasiswa Mahasiswa.
Gambar 2 Pohon Keputusan
Hijriana, N., & Rasyidan, M. (2017). Penerapan
Metode Decision Tree Algoritma C4.5 untuk
Seleksi Calon Penerima Beasiswa Tingkat
Universitas.
Yunial, A. H. (2020). Prosiding Seminar Nasional
Informatika ANALISA PERBANDINGAN
ALGORITMA KLASIFIKASI SUPPORT
VECTOR MACHINE, DECESSION TREE
DAN NAIVE BAYES.
Yutanto, H. (2018). PENERAPAN DATA MINING
SEBAGAI MODEL SELEKSI PENERIMA
BEASISWA PENUH (STUDI KASUS: STIE
PERBANAS SURABAYA).
`