The words you are searching are inside this book. To get more targeted content, please make full-text search by clicking here.

Penerapan Metode Decision Tree Pada Algoritma C4.5

Discover the best professional documents and content resources in AnyFlip Document Base.
Search
Published by afifsyarifuddin24, 2022-07-14 11:30:40

Penerapan Metode Decision Tree Pada Algoritma C4.5

Penerapan Metode Decision Tree Pada Algoritma C4.5

Keywords: data mining

Penerapan Metode Decision Tree Pada Algoritma C4.5
Untuk Seleksi Calon Penerima Beasiswa Mahasiswa

Application of the Decision Tree Method in the C4.5 Algorithm for
the Selection of Student Scholarship Recipients

Mochammad Rafi1), Muhammad Afif Syarifuddin2), Darmoro Winanjar
Sasmiko3), Regiana Abdilah4)

Teknik Informatika, Universitas Nusa Mandiri;
Jl. Damai No. 8, Warung Jati Barat, Jakarta 125407
1)[email protected], 2)[email protected],
3)[email protected], 4)[email protected]

Abstraksi

Mendapatakan pendidikan merupakan hak dan kewajiban bagi setiap warga negara. Pendidikan adalaha salah satu bagian
yang menjadi perhatian utama bagi pemerintah, dikarenakan kemajuan sebuah negara dilihat salah satunya berdasarkan dari
bagaimana kulaitas pendidikan warga negaranya. Tetapi masih banyak warga negara yang masih terhabat untuk mendapatkan
kesempatan pendidikan dikarenakan mempunyai tingkat penghasilan yang rendah. Oleh karena itu pemerintah memberikan
bantuan dana yaitu berupa beasiswa. Dalam penyaluran dana beasiswa masih terjadi masalah yaitu salah satunya adalah
beasiswa yang diberikan masih belum tepat sasaran, sehingga menyebebkan tidak maksimalnya pendayagunaan dana

beasiswa tersebut. Dari permasalahan diatas pada penelitian ini menggunakan metode Decision Tree Algoritma C4.5 dan
aplikasi Orange 3.30.2 sebagai alternatif untuk membatu proses penyeleksian calon penerima beasiswa.

Kata Kunci: Decision Tree Method, C4.5 Algortm, Scholarship, Selection.

Abstract

Getting an education is a right and an obligation for every citizen. Education is one part that is a major concern for the
government, because the progress of a country is seen, one of which is based on the quality of education of its citizens. But
there are still many citizens who are still prevented from getting educational opportunities because they have low income
levels. Therefore, the government provides financial assistance in the form of scholarships. In the distribution of scholarship
funds, there are still problems, one of which is that the scholarships given are still not on target, so that the utilization of the
scholarship funds is not optimal. From the problems above, this research uses the Decision Tree Algorithm C4.5 method and
the Orange 3.30.2 application as an alternative to help the process of selecting prospective scholarship recipients.

Keyword: Decision Tree Method, C4.5 Algortm, Scholarship, Selection.

1

1. Pendahuluan harapan beasiswa yang diberikan akan diterima oleh
yang pantas mendapatkan beasiswa tersebut. Salah

1.1 Latar Belakang satu metode yang kami gunakan untuk penelitian ini

Mendapatakan pendidikan merupakan hak dan adalah metode Decision Tree Algoritma C4.5.

kewajiban bagi setiap warga negara. Pendidikan Algoritma ini dapat digunakan sebagai alternatif untuk

adalaha salah satu bagian yang menjadi perhatian membatu proses penyeleksian calon penerima

utama bagi pemerintah, dikarenakan kemajuan sebuah beasiswa.

negara dilihat salah satunya berdasarkan dari 1.2 Perumusan Masalah

bagaimana kulaitas pendidikan warga negaranya. Dari latar belakang yang disampaikan diatas

Dengan ini negara mengusahakan dan dapat ditarik rumusan masalah pada penelitian adalah

menyelanggarakan satu sistem pendidikan dengan untuk memberikan solusi membangun proses

memprioritaskan anggaran negara sekurang- rekomendasi penerimaan beasiswa untuk mahasiswa

kurangnya 20% dari pendapatan negaranya untuk dengan menggunakan tiga kombinasi kategori

memenuhi kebutuhan penyelenggaraan pendidikan penilaian yang ada, serta memproses kategori tersebut

nasional sesuai dengan undang-undang UUD 1945. menggunakan algoritma C4.5. dalam menciptakan

Tetapi tidak dapat dipungkiri bahwa masih beberapa keputusan berdasarkan dataset dari basis data

banyak warga negara yang masih terhabat untuk penerima beasiswa.

mendapatkan kesempatan pendidikan dikarenakan 1.3 Tujuan Penelitian

mempunyai tingkat penghasilan yang rendah. Oleh Tujuan penelitian telah dilakukan untuk

karena itu pemerintah memberikan bantuan dana yaitu membantu pengambilan keputusan dalam proses seleksi

berupa beasiswa sesuai dengan undang-undang yang calon penerima beasiswa, dengan harapan agar

tercantum dalam UU No. 20 tahun 2003 tentang sistem beasiswa dapat diberikan kepada mahasiswa yang

pendidikan nasional khususnya pasa 12 ayat 1 butir c memang pantas mendapatkannya atau tepat sasaran,

dan d, dimana yang berhak memperoleh beasiswa bagi serta dapat memberikan efisiensi waktu dalam proses

yang berprestasi, yang orang tuanya tidak mampu pengambilan keputusan pada universitas.

untuk membiayai pendidikan. 1.4 Manfaat Penelitian

Dalam penyaluran dana beasiswa masih terjadi Dengan adanya penelitian ini diharapkan dapat

masalah yaitu salah satunya adalah beasiswa yang memberikan manfaat bagi perguruan tinggi untuk

diberikan masih belum tepat sasaran, sehingga melakukan penyeleksian calon penerima beasiswa

menyebebkan tidak maksimalnya pendayagunaan dengan menggunakan metode algoritma C4.5 dan dapat

dana beasiswa tersebut. Kemudian selain itu adalah menjadi referensi bagi pengembang ilmu dalam

proses seleksi penerimaan calon beasiswa terkadang melakukan klasifikasi data.

masih dilakukan secara manual sehingga proses 1.5 Ruang Lingkup Penelitian

seleksi membutuhkan waktu yang lama dan menjadi Adapun ruang lingkup untuk penelitian ini

tidak efisien. adalah melakukan klasifikasi status diterima atau

Dari permasalahan diatas sehingga kami ditolak dan mengetahui hasil akurasi klasifikasi yang

melakuakan beberapa penelitian untuk membantu telah dilakukan pada penerimaan calon beasiswa

dalam pengambilan keputsan dalam proses mahasiswa dengan metode decision tree algoritma

penyeleksian calon penerima beasiswa, dengan C4.5.

2. Tinjauan Pustaka 6. Sequence Analysis Fungsi Sequence Analysis

2.1 Data Mining adalah mencari pola urutan dari rangkaian acara.

Data Mining adalah suatu proses analisis 7. Deviation Analysis Fungsi Deviation Analysis

database yang besar secara semiotomatis untuk adalah menemukan fakta langka tapi sangat

menemuakan suatu pola yang valid, baru, berguna dan berbeda dari keadaan normal (kejadian tidak

dapat dipahami manusia (Asmira, 2019). normal).

Oleh karena itu, "Data mining" adalah istilah 2.2 Klasifikasi

umum yang digunakan untuk menggambarkan berbagai Klasifikasi adalah proses menemukan

aspek pengolahan data. Di zaman modern, hampir sekumpulan model/fungsi yang mendeskripsikan dan

semua sistem otomatis menghasilkan beberapa bentuk membedakan data ke dalam kelas-kelas tertentu,

data untuk tujuan diagnostik atau analisis. Ini telah dengan tujuan penggunaan model tersebut untuk

menghasilkan banjir data, yang telah terjadi mencapai mengidentifikasi kelas dari suatu objek yang kelasnya

urutan petabytes atau exabytes. tidak diketahui. Terdapat dua proses klasifikasi antara

Beberapa contoh berbagai jenis data seperti lain: proses pembelajaran/pelatihan yaitu membangun

jumlah dokumen pada website, interaksi keuangan, model dengan menggunakan data latih, dimana setiap

interaksi pengguna yang menghasilkan data begitu record pada data latih dianalisis berdasarkan nilai

besar, teknologi sensor dan Internet Of Thing yang saat atribut, perhitungannya menggunakan algoritma C4.5

ini sudah banyak digunakan. untuk mendapatkan model. Kemudian proses pengujian

Data Mining memiliki banyak fungsi yang adalah menguji data uji menggunakan model yang

digunakan. Fungsi data mining dapat digabungkan diperoleh dari pelatihan (Handayani et al., 2019).

dalam beberapa kasus untuk menjawab permasalahan 2.3 Decision Tree

yang ada. Berikut ini adalah Fungsi penambangan data Decision tree atau pohon keputusan adalah

umum: struktur diagram alur seperti pohon di mana setiap

1. Classification adalah untuk mengkategorikan target simpul dalam mewakili pengujian pada atribut, setiap

kelas dalam kategori yang dipilih. cabang mewakili hasil pengujian, dan simpul daun

2. Clustering adalah untuk menemukan grup atribut mewakili kelas atau distribusi kelas (Yunial et al., n.d.).

ke dalam segmentasi segmentasi berdasarkan 2.4 Algoritma C4.5

similaritas. Algoritma C4.5 adalah algoritma yang

3. Association Fungsi dari Association adalah digunakan untuk membuat pohon keputusan. Pohon

menemukan hubungan antara atribut atau set item, keputusan adalah metode klasifikasi dan prediksi yang

berdasarkan jumlah item penampilan dan sangat efisien dan terkenal. Metode pohon keputusan

Association aturan yang ada. mengubah data yang sangat besar menjadi pohon

4. Regression Fungsi Regression hampir mirip keputusan yang mewakili aturan. Aturan dapat dengan

dengan peringkat. Fungsi dari Regresi bertujuan mudah dipahami dalam bahasa alami. Dan mereka juga

untuk menemukan prediksi model yang ada. dapat diekspresikan sebagai bahasa database seperti

5. Forecasting Fungsi Forecasting adalah melihat Structured Query Language untuk menemukan record

masa depan berdasarkan trend yang terjadi di dalam kategori tertentu(Asmira, 2019).

waktu sebelumnya.

3. Metode Penelitian Tanggungan, Status.

3.4 Metode Data Mining Usulan
Metode yang diusulkan untuk seleksi

penerimaan beasiswa mahasiswa pada penelitian ini
adalah Decision Tree Algoritma C4.5 dengan
menggunakan aplikasi orange 3.30.2 untuk melakukan
pengujian dan analisa model.

3.5 Pengujian Data

Setelah metode data sudah ditentukan kemudian
kita melakukan pengujian dengan sample data
beasiswa PPA. Data sample yang digunakan terdiri dari
atribut NIM, Nama, IPK, Pendapatan Orang Tua,
Jumlah Tanggungan dan Status. Sebanyak 90% data
akan digunakan sebagai data training dan sebanyak
10% data akan digunakan sebagai data uji atau data
testing.

Gambar 1 Metode Penelitian 3.6 Evaluasi dan Validasi Model
Evaluasi diperlukan untuk menganalisa dan

3.1 Studi Pustaka mengukur sejauh mana keakuratan hasil yang telah

Yaitu melakukan studi pustaka dengan dicapai oleh model dengan menggunakan teknik atau
mengumpulkan teori, data dan informasi dari berbagai tools yang terdapat pada aplikasi orange yaitu

sumber seperti buku-buku referensi, artikel ilmiah, Confusion Matrix. Confusion Matrix adalah tool yang
serta situs di internet yang dapat membmantu digunakan untuk evaluasi model klasifikasi untuk

memperoleh pengetahuan dan pokok permasalahan memperkirakan objek yang benar atau salah.
yang berkaitan dengan materi penulisan ini. Sedangkan untuk validasi model digunakan teknik Split
Validation yaitu teknik validasi yang membagi data
3.2 Pengumpulan Data menjadi dua bagian secara acak, sebagian sebagai data

Pada tahap ini yaitu melakukan pengumpulan Penerapan Metode Decision Tree Algoritma C4.5 untuk

data-data yang akan digunakan untuk penelitian ini. Seleksi Calon Penerima Beasiswa Mahasiswa.

Data-data yang digunakan yaitu data beasiswa

Peningkatan Prestasi Akademik (PPA). 4. Algoritma Yang Digunakan

3.3 Pengelolaan Data Awal Pada penelitian ini algoritma yang digunakan
Data yang sudah didapatkan, kemudian adalah C4.5. telah dilakukan pengujian dengan
menggunakan aplikasi orange pada data beasiswa PPA
dilakukan pengolahan data yaitu pertama melakukan sebanyak 117 orang, atribut yang di gunakan NIM,
klasifikasi data. didapatkan atribut yang akan dipakai Nama Mahasiswa, IPK, Penghasilan Orang Tua,
dalam pengujian antara lain NIM, Nama Mahasiswa, Tanggungan Orang Tua, Status. Kemudian dibuat
Indeks Prestasi (IPK), Penghasilan Orang Tua, Jumlah

klasifikasi pada atribut nilai IPK, Penghasolan Orang 5. Kesimpulan & Saran

tua dan Jumlah Tangunga sebagai berikut : 5.1 Kesimpulan

Tabel 1. Klasifikasi Nilai IPK Berdasarkan Penenlitian yang telah dilakukan
maka dapat disimpulkan bahwa:

No Nilai IPK Klasifikasi 1. Dengan adanya nilai akurasi yang bagus

1 ≥ 3,6 Sangat Baik menjadikan metode Decision Tree Algoritma

2 ≥ 3,2 Baik C4.5 dapat digunakan sebagai alternatif
pendukung dalam proses seleksi penerimaan
3 ≤ 3,2 Cukup beasiswa mahasiswa.
2. Faktor tertinggi yang mempengaruhi dalam
Tabel 2. Klasifikasi Penghasilan Orang Tua

No Pengasilan Orang Tua Klasifikasi pengambilan keputusan yaitu adalah Indeks

1 ≥ 3.500.000 Sangat Tinggi Prestasi Akademik (IPK), kemudian faktor kedua
2 ≥ 2.500.000 Tinggi Penghasilan Orang Tua dan Jumlah Tanggungan
3 ≥ 1.500.000 Sedang faktor ketiga.
5.2 Saran
4 < 1.500.000 Sedikit
Dari kesmpulan yang disebutkan penulis
Tabel 3. Klasifikasi Jumlah Tanggungan memberikan saran bahwa penelitian ini dapat

No Jumlah Tanggungan Klasifikasi integrasikan ke dalam sebuah sistem penerimaan calon
1 1-2 Sedikit mahasiswa. Sekaligus dapat dikembangkan lagi
2 3-4 Sedang dengan membuat aplikasi pengambilan keputusan agar
3 ≥5 Banyak penerimaan calon beasiswa menjadi lebih efektif dan
pengujian efisien.
Kemudian dilakukan data

menggunakan aplikasi orange dengan teknik validasi Daftar Pustaka

Cross Validation. Dari hasil pengujian didapatkan nilai Asmira. (2019). Penerapan Data Mining untuk

akurasi sebesar 84,5%. Kemudian pada pengujian ini Mengklasifikasi Pola Nasabah Menggunakan

dihasilkan rata-rata nilai Precision sebesar 82,5% dan Algoritma C4.5 pada Bank Bri Unit
Anduonohu Kendari.

rata-rata nilai Recall Sebesar 84.5%. dan didapatkan rule

yang terbentuk dari pohon keputusan dapat dilihat pada Handayani, I. (2019). PENERAPAN ALGORITMA
C4.5 UNTUK KLASIFIKASI PENYAKIT DISK

gambar 2. HERNIA DAN SPONDYLOLISTHESIS

DALAM KOLUMNA VERTEBRALIS.

HARIMURTI, F. A. (2017). KLASIFIKASI
PENERIMAAN BEASISWA MENGGUNAKAN
METODE NAÏVE BAYES CLASSIFIER
(STUDI KASUS UNIVERSITAS TRUNOJOYO
MADURA).

Hasmin, E., & Hasmin, E. (2019). Penerapan
Algoritma C4.5 Untuk Penentuan Penerima
Beasiswa Mahasiswa.

Gambar 2 Pohon Keputusan

Hijriana, N., & Rasyidan, M. (2017). Penerapan
Metode Decision Tree Algoritma C4.5 untuk
Seleksi Calon Penerima Beasiswa Tingkat
Universitas.

Yunial, A. H. (2020). Prosiding Seminar Nasional
Informatika ANALISA PERBANDINGAN
ALGORITMA KLASIFIKASI SUPPORT
VECTOR MACHINE, DECESSION TREE
DAN NAIVE BAYES.

Yutanto, H. (2018). PENERAPAN DATA MINING
SEBAGAI MODEL SELEKSI PENERIMA
BEASISWA PENUH (STUDI KASUS: STIE
PERBANAS SURABAYA).

`


Click to View FlipBook Version