The words you are searching are inside this book. To get more targeted content, please make full-text search by clicking here.

Dalam buku ini, pembaca akan dihadapkan pada berbagai aspek penting seperti pengumpulan data, penyimpanan data, analisis prediktif, dan visualisasi data. Penekanan diberikan pada peran teknologi seperti machine learning, data mining, dan cloud computing dalam mengolah big data untuk mendapatkan informasi yang bermanfaat.

Penulis juga membahas tantangan yang terkait dengan big data, termasuk privasi data, keamanan informasi, dan etika penggunaan data. Dengan contoh kasus dan studi empiris, pembaca diberikan pemahaman yang mendalam tentang potensi dan risiko yang terkait dengan era big data.

Secara keseluruhan, "Buku Big Data" menjadi panduan yang sangat berharga bagi para profesional TI, analis data, dan peneliti yang tertarik untuk memahami lebih dalam tentang konsep big data dan bagaimana memanfaatkannya secara efektif. Buku ini tidak hanya memberikan wawasan mendalam tentang big data, tetapi juga memberikan strategi praktis untuk mengelola, menganalisis, dan mengambil keputusan berdasarkan informasi yang tersimpan dalam jumlah data yang besar dan kompleks.

Discover the best professional documents and content resources in AnyFlip Document Base.
Search
Published by penamudamedia, 2024-05-04 02:47:02

Big Data

Dalam buku ini, pembaca akan dihadapkan pada berbagai aspek penting seperti pengumpulan data, penyimpanan data, analisis prediktif, dan visualisasi data. Penekanan diberikan pada peran teknologi seperti machine learning, data mining, dan cloud computing dalam mengolah big data untuk mendapatkan informasi yang bermanfaat.

Penulis juga membahas tantangan yang terkait dengan big data, termasuk privasi data, keamanan informasi, dan etika penggunaan data. Dengan contoh kasus dan studi empiris, pembaca diberikan pemahaman yang mendalam tentang potensi dan risiko yang terkait dengan era big data.

Secara keseluruhan, "Buku Big Data" menjadi panduan yang sangat berharga bagi para profesional TI, analis data, dan peneliti yang tertarik untuk memahami lebih dalam tentang konsep big data dan bagaimana memanfaatkannya secara efektif. Buku ini tidak hanya memberikan wawasan mendalam tentang big data, tetapi juga memberikan strategi praktis untuk mengelola, menganalisis, dan mengambil keputusan berdasarkan informasi yang tersimpan dalam jumlah data yang besar dan kompleks.

139 ada zaman sekarang ini dan masa depan yang akan datang, manusia dapat mengendalikan dan menguasai dunia adalah orang-orang yang menguasi ilmu big data. Dengan Big Data orang-orang yang mempunyai kemampuan dalam menganalisis fakta dalam jumlah besar. Hasil yang telah dianalisis dapat dijadikan solusi dalam pemecahan berbagai masalah dan membantu orang-orang dalam memprediksi halhal yang bisa diimpelentasikan di berbagi sektor dan kebutuhan dalam kehidupan. Perkembangan teknologi yang sangat pesat pada era revolusi industri 4.0 menuju era society 5.0 banyak g[ms[l[e[n ^ohc[ g_g\c][l[e[h ‚BIG DATA‛. Entah disadari atau tidak, sebenarnya setiap hari orangorang banyak berinteraksi langsung dengan layanan agtaupun produk yang dihasilkan oleh big data. Pemanfaatan big data dapat memberikan keunggulan kompetitif bagi organisasi dan P


140 - masyarakat secara keseluruhan. Namun, penting untuk memahami bahwa kesuksesan dalam pemanfaatan big data memerlukan strategi yang matang, investasi yang tepat dalam teknologi dan sumber daya manusia, serta kebijakan yang memperhatikan aspek-etika dan privasi data. Big data adalah inovasi yang revolusioner dari revolusi industri keempat yang memudahkan pengelolaan, penyimpanan, dan analisis data dalam jumlah besar dari berbagai sumber. Ini mencakup domain masalah di mana teknologi konvensional seperti basis data relasional tidak lagi memadai (Supriyanto, 2016). Kata "besar" dalam konteks ini menyoroti volume, kecepatan, dan keragaman data [1].Pesatnya pertumbuhan big data juga dapat dimanfaatkan untuk mendorong pertumbuhan ekonomi dan bisnis. Banyak perusahaan besar dan usaha kecil dan menengah (UKM) yang memanfaatkan teknologi big data ini. Meskipun penggunaan big data itu rumit dan mahal, bahkan usaha kecil dan menengah yang miskin modal pun bisa mendapatkan manfaat dari big data dengan mengetahui tujuan bisnis mereka secara tepat, sehingga lebih mudah untuk mengidentifikasi data yang mereka perlukan. Peran big data serta peluang dan tantangan yang dihadapi dalam memanfaatkan big data [2]. Penerapan big data telah membuka berbagai peluang di berbagai bidang. Big data telah menjadi pendorong utama inovasi di berbagai sektor. Dari bisnis hingga ilmu pengetahuan, teknologi ini telah merevolusi cara kita mengumpulkan, menganalisis, dan memahami data. Berikut adalah beberapa contoh penerapan big data pada bidang-bidang yang berbeda:


141 A. Bisnis dan pemasaran Dalam era digital yang terus berkembang, Big Data telah menjadi salah satu aset terbesar dan paling berharga bagi perusahaan di berbagai sektor, terutama dalam bidang bisnis dan pemasaran. Big Data merujuk pada volume data yang sangat besar yang dihasilkan setiap detik dari berbagai sumber, termasuk transaksi online, interaksi pelanggan, sensor IoT (Internet of Things), media sosial, dan banyak lagi. Dalam sektor bisnis dan pemasaran, Big Data telah mengubah lanskap secara fundamental. Data yang besar dan kompleks ini menawarkan wawasan yang berharga kepada perusahaan, memungkinkan mereka untuk membuat keputusan yang lebih baik, memahami pelanggan dengan lebih baik, dan mengoptimalkan strategi pemasaran mereka. Peran Big Data dalam sektor bisnis dan pemasaran bisa dipahami melalui beberapa aspek kunci: 1. Pemahaman Pelanggan yang mendalam Big Data memungkinkan perusahaan untuk mengumpulkan, menyimpan, dan menganalisis data pelanggan dari berbagai sumber. Dengan analisis yang tepat, perusahaan dapat memahami preferensi, perilaku, dan kebutuhan pelanggan dengan lebih baik. Hal ini memungkinkan mereka untuk menyesuaikan produk, layanan, dan pengalaman pelanggan secara lebih efektif. 2. Personalisasi Berkat Big Data, perusahaan dapat membuat kampanye pemasaran yang lebih terarah dan personal kepada pelanggan mereka. Dengan memahami data


142 - pelanggan secara individu, perusahaan dapat menyampaikan pesan yang lebih relevan dan menarik, meningkatkan tingkat keterlibatan dan respons pelanggan. 3. Analisis tren pasar dan prediksi Big Data memungkinkan perusahaan untuk menganalisis tren pasar secara mendalam dan memprediksi perilaku pasar di masa depan. Dengan memahami tren-tren ini, perusahaan dapat menyesuaikan strategi pemasaran mereka, mengidentifikasi peluang baru, dan menghindari risiko yang tidak diinginkan. 4. Optimasi operasional dan efisiensi Selain membantu dalam pemasaran, Big Data juga memungkinkan perusahaan untuk mengoptimalkan proses operasional mereka. Dengan menganalisis data operasional seperti rantai pasokan, inventaris, dan proses produksi, perusahaan dapat mengidentifikasi area-area di mana efisiensi dapat ditingkatkan dan biaya dapat dikurangi. 5. Pengambilan keputusan yang didukung oleh data. Big Data memungkinkan perusahaan untuk membuat keputusan yang lebih baik dan lebih cepat berdasarkan fakta-fakta dan analisis data yang akurat. Dengan memiliki wawasan yang lebih dalam tentang bisnis mereka, perusahaan dapat merespons perubahan pasar dengan lebih efektif dan memenangkan persaingan.


143 B. Pemerintahan Pada sistem open government big data memiliki beberapa peranan penting untuk mewujudkan implementtasi open government yang optimal. World Bank (2017) memberikan beberapa penjelasan mengenai penggunaan big data pada pemerintahan yang mana sekiranya ada tiga hal yang dapat dikembangkan oleh big data pada sistem pemerintahan antara lain adalah service delivery, policy making dan citizen engagement [3]. Pemerintah suatu negara memutuskan untuk memanfaatkan kekuatan big data dalam upaya meningkatkan pelayanan publik dan membuat kebijakan yang lebih tepat sasaran. Mereka menyadari bahwa data yang mereka miliki, seperti data sensus, catatan perpajakan, dan data lainnya, sangat berharga jika dapat dianalisis dan dimanfaatkan dengan benar. Pertama, pemerintah membentuk tim khusus yang terdiri dari para ahli big data, analis data, dan perwakilan dari berbagai departemen pemerintahan. Tim ini bertugas mengumpulkan, mengintegrasikan, dan mengolah data dari berbagai sumber pemerintah serta sumber data publik lainnya. Big data sangat berperan penting dalam sektor pemerintahan seperti : 1. Dibidang Kesejahteraan Sosial Analisis big data membantu pemerintah mengidentifikasi kelompok masyarakat yang membutuhkan bantuan dengan lebih baik. Mereka dapat memetakan daerah-daerah dengan tingkat kemiskinan tinggi, tingkat pendidikan rendah, atau akses terbatas terhadap layanan publik


144 - 2. Mendeteksi kecurangan dan korupsi Dengan memeriksa pola transaksi, pengeluaran, dan aktivitas lainnya, pemerintah dapat mengidentifikasi potensi penyimpangan dan mengambil tindakan yang diperlukan. C. Keuangan dan Perbankan Big data telah membawa perubahan signifikan dalam industri keuangan dan perbankan. Dengan memanfaatkan volume data yang besar, kecepatan, dan keragaman data, institusi keuangan dapat meningkatkan efisiensi operasional, mengelola risiko dengan lebih baik, dan menyediakan layanan yang lebih personal bagi nasabah. Berikut adalah beberapa contoh penerapan big data di sektor keuangan dan perbankan: 1. Manajemen Risiko dan Pencegahan Penipuan. Analisis big data memungkinkan bank untuk mengidentifikasi pola transaksi yang mencurigakan, mendeteksi penipuan, dan melacak aktivitas keuangan ilegal dengan lebih akurat dan tepat waktu. 2. Pemasaran dan Loyalitas Nasabah Big data memungkinkan bank untuk memahami preferensi dan perilaku nasabah secara lebih mendalam, sehingga mereka dapat menawarkan produk dan layanan yang lebih personal dan relevan. 3. Optimalisasi Operasional. Analisis big data dapat digunakan untuk mengoptimalkan alokasi sumber daya, meningkatkan efisiensi proses bisnis, dan mengurangi biaya operasional. Dengan menganalisis data dari berbagai


145 sumber seperti transaksi, log sistem, dan data sensor, bank dapat mengidentifikasi area yang membutuhkan perbaikan dan mengambil tindakan yang tepat [4]. 4. Analisis Sentimen dan Pengalama Nasabah. Big data memungkinkan bank untuk memantau dan menganalisis sentimen nasabah dari berbagai sumber data seperti media sosial, umpan balik, dan interaksi dengan call center. 5. Keputusan dan Regulasi. Big data membantu bank dalam memenuhi persyaratan kepatuhan dan regulasi dengan lebih efektif, seperti pemantauan transaksi mencurigakan, penilaian risiko, dan pelaporan yang diperlukan. D. Perawatan dan Kesehatan Sektor kesehatan sendiri telah menjadi salah satu penerima manfaat utama dari potensi besar yang dimiliki oleh Big Data. Dengan informasi yang lebih akurat dan cepat, pelayanan kesehatan, yang bisa disesuaikan secara personal dalam memenuhi kebutuhan pasisen secara lebih efektif [5]. Berikut adalah beberapa contoh penerapan big data di sektor perawatan dan kesehatan: 1. Manajemen Perawatan Kesehatan Analisis big data memungkinkan penyedia layanan kesehatan untuk memantau dan mengoptimalkan alur kerja, alokasi sumber daya, dan efisiensi operasional secara keseluruhan dan Data dari catatan kesehatan elektronik, data klaim, dan sumber lain dapat dianalisis


146 - untuk mengidentifikasi pola, tren, dan area yang membutuhkan perbaikan. 2. Perawatan Terpersonalisasi dan Prediktif Dengan mengintegrasikan data genetik, data klinis, dan data gaya hidup, big data dapat membantu dalam pengembangan perawatan kesehatan yang disesuaikan secara personal bagi setiap pasien, Analisis prediktif dapat digunakan untuk mengidentifikasi pasien berisiko tinggi dan memungkinkan intervensi dini serta pencegahan yang lebih baik. 3. Penelitian Medis dan Pengembangan Obat Big data memungkinkan peneliti untuk menganalisis data dari berbagai sumber, seperti uji klinis, catatan medis, dan literatur akademik, untuk mengidentifikasi pola, mengembangkan obat baru, dan meningkatkan pengobatan, Analisis data genomik dan data fenotipik dapat membantu dalam pengembangan obat-obatan yang lebih tepat sasaran dan personalisasi pengobatan. 4. Manajemen Penyakit Kronis Big data dapat digunakan untuk memantau dan mengelola kondisi penyakit kronis, seperti diabetes, penyakit jantung, dan kanker, dengan lebih efektif, Dengan menganalisis data dari perangkat pemantauan kesehatan, catatan medis, dan data gaya hidup, penyedia layanan kesehatan dapat menyediakan saran dan intervensi yang tepat untuk meningkatkan hasil perawatan. 5. Deteksi Wabah dan Surveilans Penyakit Analisis big data memungkinkan otoritas kesehatan untuk memantau dan mendeteksi wabah penyakit


147 secara lebih efektif dengan menggunakan data dari berbagai sumber, seperti media sosial, pencarian internet, dan laporan klinik, Ini membantu dalam mengidentifikasi pola penyebaran penyakit dan memungkinkan respons yang lebih cepat dan tepat sasaran. E. Transportasi Big data telah membawa perubahan signifikan dalam sektor transportasi, memungkinkan peningkatan efisiensi operasional, optimalisasi rute, manajemen aset yang lebih baik, dan pengalaman pengguna yang lebih baik. Berikut adalah beberapa contoh penerapan big data di sektor transportasi: 1. Manejemen Lalu Lintas dan Perencanaan Transportasi. Analisis big data dari sensor lalu lintas, kamera, dan data GPS memungkinkan otoritas transportasi untuk memantau dan mengoptimalkan aliran lalu lintas secara real-time, Data historis dan data real-time dapat digunakan untuk memprediksi kemacetan lalu lintas dan merancang rute alternatif yang lebih efisien. 2. Logistik dan Manajemen Rantai Pasokan Big data memungkinkan perusahaan logistik untuk melacak dan mengoptimalkan pergerakan barang secara real-time, meminimalkan keterlambatan, dan meningkatkan efisiensi operasional, Prediksi permintaan yang lebih akurat dapat dicapai dengan menganalisis data historis, data cuaca, dan data peristiwa.


148 - 3. Perawatan Prediktif dan Pemantauan Aset. Big data memungkinkan pemantauan kondisi aset transportasi seperti pesawat, kereta api, dan kendaraan secara real-time, Perawatan prediktif dapat meningkatkan keselamatan, mengurangi biaya, dan memperpanjang umur aset transportasi . 4. Pengalaman Pengguna yang Lebih Baik. Analisis big data dari data pengguna, data perjalanan, dan data preferensi dapat membantu penyedia layanan transportasi untuk menyesuaikan layanan mereka dan memberikan pengalaman yang lebih personal. 5. Keselamatan dan Keamanan Big data dapat digunakan untuk mengidentifikasi pola perilaku pengemudi berisiko tinggi, area rawan kecelakaan, dan potensi ancaman keamanan, Analisis data dari kamera pengawas, sensor kendaraan, dan data lalu lintas


149 enganalisis big data untuk mendapatkan pengetahuan berharga menjadi kebutuhan penting di era digital ini. Namun, mengolah dan menganalisis big data bukanlah tugas yang mudah. Diperlukan teknik dan alat yang tepat untuk dapat mengekstrak pengetahuan berharga dari data yang kompleks dan berukuran besar. Hadoop menyediakan infrastruktur terdistribusi untuk penyimpanan dan pemrosesan data dalam skala besar yang efisien. Big data yang tersebar di banyak server memungkinkan proses analisis dilakukan secara paralel, sehingga mempercepat proses dan dapat menghasilkan insights lebih cepat. Machine learning menyediakan teknik untuk menganalisis data, mengenali pola dan tren dalam big data, serta mengekstrak M


150 - pengetahuan yang berharga. Kolaborasi antara machine learning dan Hadoop memungkinkan pemrosesan data dalam skala besar dapat dilakukan secara paralel di banyak komputer. Hadoop memungkinkan algoritma machine learning memproses data terdistribusi secara bersamaan pada banyak server, menjadikan analisis big data lebih efisien. Bab ini mengupas penerapan algoritma clustering (pengelompokkan), sebuah metode machine learning yang termasuk dalam kategori unsupervised learning, pada sistem terdistribusi Hadoop. Penerapan ini difokuskan pada algoritma k-means paralel untuk dua tujuan berbeda, yaitu pencarian informasi atau pengetahuan dari pola cluster (kelompok) dan teknik untuk penentuan awal titik tengah cluster. A. Pencarian Pengetahuan dari Pola Cluster Menggunakan Algoritma K-means Clustering Secara Pararel dengan Hadoop MapReduce K-means merupakan salah satu algoritma clustering yang populer karena kesederhanaan dan efektivitasnya dalam mempartisi objek data ke dalam kelompok berdasarkan kemiripan karakteristik (Ha et al., 2011). Secara garis besar, cara kerja algoritma k-means diawali dengan menentukan jumlah cluster (k) dan menginisialisasi centroid atau titik pusat setiap cluster. Untuk membagi objek data ke dalam cluster, k-means melakukan iterasi hingga mencapai konvergensi, yaitu kondisi di mana tidak ada lagi perubahan signifikan dalam proses penempatan objek data ke cluster. Pada setiap iterasi, terdapat dua proses yang dilakukan, penempatan seluruh objek data ke centroid terdekat dan pembaharuan centroid.


151 Hadoop, dengan kemampuan pemrosesan terdistribusi, sangat cocok untuk menjalankan k-means secara paralel untuk big data. Algoritma k-means paralel diimplementasikan dengan memanfaatkan paradigma MapReduce untuk memproses data secara paralel yang tersimpan secara terdistribusi pada HDFS (Hadoop Distributed File Sytem). Penerapan k-means paralel dengan Hadoop MapReduce terdiri dari tiga tahapan utama, meliputi fungsi Job, Map, , dan Reduce. Secara garis besar, fungsi Map menjalankan prosedur penetapan tiap sampel atau objek data ke centroid terdekat, sementara fungsi Reduce menjalankan prosedur pembaruan sebanyak k centroid baru (Zhao et al., 2009). Gambar 1. Proses MapReduce pada Implementasi Algoritma K-means Paralel 1. Fungsi Job Fungsi Job memiliki tiga tugas utama antara lain menangani data masukan dan keluaran, menjalankan fungsi MapReduce, serta mengatur iterasi. Ketiga tugas


152 - tersebut bertanggung jawab dalam jalannya proses kmeans paralel pada Hadoop. Data yang terbagi menjadi potongan-potongan kecil (block) dan terdistribusi di banyak node (komputer) pada HDFS dibaca oleh fungsi Job untuk dijadikan masukan fungsi MapReduce dari k-means paralel. Set data yang digunakan haruslah terlebih dahulu dipraolah agar format setiap objek data yang ada di dalamnya berupa pasangan key dan value. Key merupakan nilai offset, yaitu index atau lokasi objek data tersebut berada pada file. Value merupakan isi dari objek data. Value terdiri dari id objek beserta dengan atribut-atribut yang dimilikinya. Fungsi Job juga memastikan file data inisial centroid tersedia dan nilai k telah ditentukan. Implementasi k-means paralel ini menghasilkan file keluaran yang berisi centroid baru beserta dengan objek-objek yang menjadi anggotanya. File yang berisi centroid baru akan digunakan untuk iterasi selanjutnya jika kondisi konvergen belum dapat dicapai. Penentuan kondisi konvergen diimplementasikan pada fungsi Job. Kondisi konvergen ini akan menentukan apakah iterasi masih harus dilakukan atau tidak. Jika iterasi masih harus dilakukan, maka fungsi Job bertugas untuk mengaktifkan fungsi Map dan Reduce untuk mengerjakan proses clustering. 2. Fungsi Map Set data masukan yang tersimpan secara terdistribusi di HDFS sebagai rangkaian file yang berisi


153 pasangan key dan value (key, value) akan disebar ke seluruh Mapper yang bekerja di setiap node. Fungsi Map akan menghitung jarak setiap objek data dengan setiap centroid. Setiap objek data selanjutnya dikelompokkan berdasarkan centroid terdekat. Keluaran dari fungsi Map merupakan pasangan key dan value baru (key', value'), di mana key merupakan id kelompok tempat objek tersebut tergabung berdasarkan centroid terdekat dan value merupakan id objek, jarak objek ke centroid, dan atribut-atribut yang dimiliki objek data. Gambar 1 mengilustrasikan masukan dan keluaran dari proses pada fungsi Map. Algoritma 1 menunjukkan proses yang dilakukan di fungsi Map untuk k-means yang berjalan pada MapReduce.


154 - Setelah tahap Map selesai, terjadi sebuah proses yang dinamakan suffle dan sort. Proses tersebut merupakan proses pertukaran data melalui jaringan yang terjadi antara setiap node yang bekerja pada


155 cluster Hadoop. Data intermediate berupa pasangan k_s’ dan p[fo_’ yang dihasilkan oleh fungsi Map dari semua node dikumpulkan dan diurutkan berdasarkan e_s’. Pada pemrosesan data terdistribusi, ada kondisi dimana data yang perlu dikirim saat proses shuffle dapat dikurangi jumlanya dengan menggunakan teknik yang disebut combiner (Jeyaraj et al., 2020). Dengan combiner, jumlah data yang dikirim dari Mapper ke Reducer melalui jaringan dapat diminimalisir. Combiner efektif jika fungsi yang digunakan di tahap Reduce bersifat distributif, seperti mencari nilai maksimum, minimum, atau jumlah total. Namun, banyak fungsi reducer yang tidak bersifat distributif, sehingga penggunaan combiner belum tentu membuat keseluruhan proses menjadi lebih efisien (Jeyaraj et al., 2020). 3. Fungsi Reduce Fungsi Reduce akan mengumpulkan seluruh pasangan key' dan value' yang dihasilkan oleh fungsi Map. Keluaran yang dihasilkan pada fungsi Map menjadi masukan untuk fungsi Reduce. Pada tahap Reduce, node yang bertanggung jawab untuk setiap key' akan menerima semua objek data yang terasosiasi dengan key' tersebut. Dengan begitu, seluruh objek data yang memiliki key' yang sama akan digabungkan dan diolah pada node s[ha m[g[ (e_s’, fcmn(p[fo_’)). Node ini kemudian menghitung ulang


156 - centroid baru berdasarkan rata-rata value' dari semua objek data yang diterima. Keluaran yang dihasilkan oleh fungsi Reduce ditunjukkan oleh Gambar 1. Tujuan dari proses clustering k-means paralel pada pembahasan di sub bab ini adalah untuk mencari pola cluster yang dapat digunakan untuk menggali pengetahuan berharga pada data. Dengan begitu, fungsi Reduce sebagai bagian terakhir tahapan k-means paralel dirancang untuk menghasilkan keluaran berupa informasi atau pola penting cluster yang ingin diperoleh dari proses clustering yang dilakukan. Format setiap centroid baru yang dihasilkan oleh fungsi Reduce adalah sepasang key" dan value" di mana key" merupakan id cluster (kelompok) atau id Reducer, sedangkan value" merupakan pola cluster yang terdiri dari atribut-atribut objek centroid baru dan data lainnya yang dibutuhkan. Fungsi Reduce pada algoritma clustering menghasilkan keluaran data yang bermanfaat, tidak hanya atribut centroid. Keluaran ini termasuk nilai maksimum dan minimum setiap atribut, standar deviasi, jumlah anggota cluster, beragam jenis perhitungan kumulatif, nilai koefisien Silhouete untuk setiap objek data, dan total jarak antar objek data dan centroid. Total jarak membantu fungsi Job menentukan apakah centroid sudah mencapai konvergensi. Pola cluster yang dihasilkan juga dapat digunakan untuk mengevaluasi kualitas cluster (Moertini and Venica, 2017).


157 Jika kondisi konvergen telah tercapai, maka proses clustering selesai dan file keluaran yang dihasilkan dari fungsi Reduce pada iterasi terakhir disimpan pada HDFS. Jika kondisi konvergen belum tercapai, maka fungsi Job akan mengatur untuk dilakukan iterasi kembali memanfaatkan centroid baru yang telah dihasilkan pada iterasi sebelumnya. Algoritma 2 menunjukkan proses yang dilakukan di fungsi Reduce untuk k-means yang berjalan pada MapReduce.


158 - Jumlah iterasi yang dilakukan oleh algoritma kmeans sangat dipengaruhi oleh inisial centroid yang digunakan (Moertini dan Venica, 2016). Pada sub bab berikutnya dibahas mengenai teknik untuk menentukan inisial centroid yang optimal agar jumlah iterasi pada proses clustering k-means dapat lebih efisien.


159 B. K-means Paralel dengan Hadoop MapReduce untuk Optimalisasi Pemilihan Inisial Centroid Kualitas dari hasil pengelompokan menggunakan algoritma k-means ditentukan oleh seberapa baik inisial centroid yang digunakan pada iterasi pertama algoritma kmeans. Inisial centroid akan mempengaruhi seberapa banyak iterasi yang dilakukan pada saat proses clustering. Karena data yang dikelompokkan jumlahnya besar, maka untuk mengurangi banyaknya iterasi yang dilakukan pada proses clustering, inisial centroid disarankan tidak diperoleh secara bebas atau acak oleh pengguna. Inisial centroid yang optimal dapat diperoleh dengan menerapkan teknik clustering terhadap sebagian besar data dari keseluruhan big data yang akan diproses (Ma et al., 2015) (Moertini and Venica, 2016). Algoritma k-means dapat digunakan untuk mencari inisial centroid yang optimal untuk mengelompokkan set data yang besar (Moertini and Venica, 2016). Gambar 2. Proses Pencarian Inisial Centroid Terbaik


160 - Gambar 2 menunjukkan cara mendapatkan inisial centroid untuk algoritma k-means paralel dengan MapReduce pada Hadoop. Pertama, sampel data dari keseluruhan data yang akan dikelompokkan diambil. Untuk kebutuhan ini, inisial centroid bebas ditentukan oleh pengguna. Setelah proses pengelompokan pada sampel data selesai, centroid baru hasil iterasi terakhir diperoleh. Centroid ini kemudian digunakan sebagai inisial centroid untuk mengelompokkan seluruh set data. Hal ini membantu memperkecil jumlah iterasi pada proses clustering, sehingga prosesnya menjadi lebih cepat.


161 Apache Hadoop (no date). Available at: https://hadoop.apache.org/ (Accessed: 13 March 2024). Al-Garadi, M. A., Hussain, M. R., Khan, N., Murtaza, G., Nweke, H. F., Ali, I., Mujtaba, G., Chiroma, H., Khattak, H. A., & Gani, A. (2019). Predicting Cyberbullying on Social Media in the Big Data Era Using Machine Learning Algorithms: Review of Literature and Open Challenges. IEEE Access, 7, 70701–70718. https://doi.org/10.1109/ACCESS.2019.2918354 A.-L. Tbc_off_hn _n [f., ‚Tb_ ^[n[-powered enterprise - Why organizations must strengthen their data g[mn_ls,‛ Capgemini White Pap., p. 64, 2020, [Online]. Available: https://www.capgemini.com/de-de/wpcontent/uploads/sites/5/2020/11/CRI_Data-poweredenterprises_Infographic.pdf. Angwin, J., Larson, J., Mattu, S., & Kirchner, L. (2016). Machine Bias: There’m Si`nq[l_ Um_^ A]limm nb_ Ciohnls ni Pl_^c]n Fonol_ Clcgch[fm. Ah^ In’m Bc[m_^ Aa[chmn Blacks. ProPublica. https://www.propublica.org/article/machine-bias-riskassessments-in-criminal-sentencing


162 - Buolamwini, J., & Gebru, T. (2018). Gender Shades: Intersectional Accuracy Disparities in Commercial Gender Classification. Proceedings of the 1st Conference on Fairness, Accountability and Transparency, PMLR 81:77-91, 2018. http://proceedings.mlr.press/v81/buolamwini18a.html Balusamy, B. et al. (2021) Big Data : Concepts, Technology, and Architecture. John Wiley & Sons, Inc. Buyya, R., Calheiros, R. N. & Dastjerdi, A. V., 2016. Big Data Priciples and Paradigms. s.l.:Morgan Kaufmann. Bryce Merkl Sasaki, J.C.& R.H. (2018) Graph Databases For Beginners. Neo4j. Bhutanadhu, K. (2023) Introduction to Apache Oozie, analyticsvidhya.com. Available at: https://www.analyticsvidhya.com/blog/2023/03/introdu ction-to-apache-oozie/ (Accessed: 13 March 2024). Blanchette, Meghan., Demarest, Rebecca., Downy, Allen., Kersey, Amanda., Loukides, Michael Kosta., Montgomery, K. (2015). Think stats: exploratory data analysis. O’R_cffs. Boyd, D., & Crawford, K. (2012). Critical Questions for Big Data: Provocations for a Cultural, Technological, and Scholarly Phenomenon. Information, Communication & Society, 15(5), 662-679. Culnan, M. J., & Williams, C. C. (2009). How ethics can enhance organizational privacy: Lessons from the choicepoint


163 and tjx data breaches. MIS Quarterly, 33(4), 673–687. https://www.jstor.org/stable/20650381 Capgemini Research Institute. (2020). "The Sustainability Advantage: How Environmental, Social, and Governance Activities Can Increase Enterprise Value." Capgemini. Cadwalladr, C., & Graham-Harrison, E. (2018, March 17). Revealed: 50 million Facebook profiles harvested for Cambridge Analytica in major data breach. The Guardian. https://www.theguardian.com/news/2018/mar/17/camb ridge-analytica-facebook-influence-us-election Capriolo, E., Wampler, D. and Rutherglen, J. (2012) Programming Hive. 1mn E^cncih. O’R_cffs. Ap[cf[\f_ [n: www.wowebook.com. Choudhary, F. (2023) Top 15 Hadoop Ecosystem Components in 2023: A Comprehensive Guide, codewithFaraz.com. Available at: https://www.codewithfaraz.com/article/78/top-15- hadoop-ecosystem-components-in-2023-acomprehensive-guide (Accessed: 22 February 2024). Carm_fc, A.B., M_fih_s, L. [h^ Bc_l_l, B.E. (2023) ‘D[n[ visualization explorer: A tool for participant representation in pivotal trials of FDA-approved g_^c]ch[f jli^o]nm’, Patterns, 4(5). Available at: https://doi.org/10.1016/j.patter.2023.100713. Chambers, Bcff [h^ M[n_c Z[b[lc[, ‚Sj[le: Tb_ D_`chcncp_ Goc^_‛ Christian, L. (2022). Bagaimana Big Data Analytics Menggunakan


164 - Machine Learning. School of Information Systems BINUS University. https://sis.binus.ac.id/2022/05/20/bagaimana-big-dataanalytics-menggunakan-machine-learning/ DataFlair (2017) 13 Big Limitations of Hadoop & Solution To Hadoop Drawbacks, DataFlair. Available at: https://data-flair.training/blogs/13-limitations-ofhadoop/ (Accessed: 16 March 2024). Damji, Jules S., Brooke Wnig, Tathagata Das, and Denny Lee, ‚L_[lhcha Sj[le: Lcabnhcha-F[mn D[n[ Ah[fsnc]m‛ Diehl, S. (2010) Software Visualization : Visualizing the Structure, Behaviour, and Evolution of Software. Heidelberg: Springer. Dioaf[m, L. (2012) ‘Tb_ Igjiln[h]_ i` ‚Bca D[n[‛: A D_`chcncih’. Erl, T., Khattak, W. & Buhler, P., 2015. Big Data Fundamentals: Concepts, Drivers, & Techniques. s.l.:Prentice Hall. EMC Education Services (2015) Data Science and Big Data Analytics: Discovering, Analyzing, Visualizing and Presenting Data. Wiley. E. R. W[b`c[he[ [h^ U. G. M[^[, ‚P_g[h`[[n[h Bca D[n[ D[f[g M_hchae[ne[h Ko[fcn[m P_f[s[h[h,‛ hi. Joh_, 2022. Eubanks, V. (2018). "Automating Inequality: How High-Tech Tools Profile, Police, and Punish the Poor." St. Martin's Press. Fatmawati, D., Trisnawati, W., Jumaryadi, Y., & Triyono, G.


165 (2023). Klasifikasi Tingkat Kepuasan Penggunaan Layanan Teknologi Informasi Menggunakan Decision Tree. KLIK: Kajian Ilmiah Informatika Dan Komputer, 3(6), 1056–1062. https://doi.org/10.30865/klik.v3i6.803 Fitri Handayani, & Feddy Setio Pribadi. (2015). Implementasi Algoritma Naive Bayes Classifierdalam Pengklasifikasian Teks OtomatisPengaduan dan Pelaporan Masyarakat melaluiLayanan Call Center 110. Jurnal Teknik Elektro, 7(1), 1–6. F_ha, W_hakc[ha, ‚L_[lhcha Aj[]b_ Sj[le qcnb Psnbih‛, https://runawayhorse001.github.io/LearningApacheSpa rk Floridi, L. (2014). The fourth revolution: How the infosphere is reshaping human reality. Oxford University Press. Gis[f, Ah_me[b, ‚Ah chnli^o]ncih ni Aj[]b_ Sj[le: A `f_rc\f_ data processing fl[g_qile,‛ bnnjm://g_^cog. com/expedia-group-tech/an-introduction-to-apachespark-f0795f2d5201, diakses pada 19 Februari 2024. Gaurav Vaish (2013) Getting Started with NoSQL. Packt Publishing Ltd. Gates, A. (2011) Programming Pig. 1mn E^cncih. O’R_cffs. Available at: www.it-ebooks.info. Geeksforgeeks.org (2024) Distributed Coordination services (ZooKeeper) | System design, www.geeksforgeeks.org. Available at: https://www.geeksforgeeks.org/distributedcoordination-services-zookeeper-system-design/ (Accessed: 15 March 2024).


166 - George, L. (2010) HBase - The Definitive Guide - 2nd Edition. 2nd E^cncih. O’R_cffs. Greenwald, G., MacAskill, E., & Poitras, L. (2019). "No Place to Hide: Edward Snowden, the NSA, and the U.S. Surveillance State." Henry Holt and Company. Ha, J., Kambe, M., Pe, J., 2011. Data Mining: Concepts and Techniques, Data Mining: Concepts and Techniques. https://doi.org/10.1016/C2009-0-61819-5 Hong, L., & Page, S. E. (2004). Groups of diverse problem solvers can outperform groups of high-ability problem solvers. Proceedings of the National Academy of Sciences, 101(46), 16385–16389. https://doi.org/10.1073/pnas.0403723101 Harrison, Matt., Petrou, T. (2020). Pandas 1.x Cookbook (2nd Editio). Packt Publishing. Hoaglin, David C., Mosteller, Frederick., Tukey, J. W. (2006). Exploring Data Tables, Trends, and Shapes (J. W. Hoaglin, David C., Mosteller, Frederick., Tukey (ed.)). Wiley-Interscience. Irzavie[, N. [h^ Soj[hae[n, S.H. (2018) ‘D_m]lcjncp_ Ah[fsnc]m Using Visualization for Local Government Income in Ih^ih_mc[’, ch 2018 International Conference on ICT for Smart Society (ICISS). IEEE, pp. 1–4. Available at: https://doi.org/10.1109/ICTSS.2018.8550006. Johnston, A. C., Warkentin, M., & Sharma, S. (2019). Ethical considerations in research on privacy and cybersecurity: A framework for ethics review.


167 Information & Management, 56(1), 64–75. https://doi.org/10.1016/j.im.2018.06.007 Jeyaraj, R., Pugalendhi, G., Paul, A., 2020. Big Data with Hadoop MapReduce, Big Data with Hadoop MapReduce. https://doi.org/10.1201/9780429321733 Jiraporn, P., Kim, J. C., Kim, Y. S., & Kitsabunnarat, P. (2012). Capital structure and corporate governance quality: Evidence from the Institutional Shareholder Services (ISS). International Review of Economics and Finance. https://doi.org/10.1016/j.iref.2011.10.014 Kaisler, S., Armour, F., Espinosa, J.A. and Money, W., 2013. Big data: Issues and challenges moving forward. Proceedings of the Annual Hawaii International Conference on System Sciences, pp.995–1004. https://doi.org/10.1109/HICSS.2013.645. Kamal, R. and Saxena, P. (2020) Big Data Analytics Introduction to Hadoop, Spark, and Machine-Learning. McGraw Hill Education. Available at: https://openlibrary.telkomuniversity.ac.id/pustaka/1637 45/big-data-analytics-introduction-to-hadoop-sparkand-machine-learning.html (Accessed: 12 February 2024). Karanth, S. (2014) Mastering Hadoop: go beyond the basics and master the next generation of Hadoop data processing platforms. Birmingham, England: Packt Publishing. Kamal, R. and Saxena, P. (2019) Big Data Analytics. McGraw Hill Education (India) Private Limited 444/1,.


168 - Kominfo (2020) Bertambah 316 Kasus, Positif Covid-19 di Indonesia Jadi 4.557 Kasus, www.kominfo.go.id/. Available at: https://www.kominfo.go.id/ (Accessed: 15 March 2024). Kleppmann, M. (2017) Designing Data-Intensive Applications - The Big Ideas Behind Reliable, Scalable, and Maintainable Systems. O’R_cffs M_^c[, Ih]. Kawani, G. P. (2015). Implementasi Naive Bayes Dalam Memprediksi Besarnya Penggunaan Listrik Listrik Rumah Tangga. Creative Information Technology Journal (CITEC), 2(3), 207–217. https://doi.org/10.20895/inista.v1i2.73 L’H_ol_or, A., Glifcha_l, K., Efs[g[hs, H. F., & C[jl_nt, M. A. M. (2017). Machine Learning with Big Data: Challenges and Approaches. IEEE Access, 5, 7776–7797. https://doi.org/10.1109/ACCESS.2017.2696365 Loshin, D. (2013) Big Data Analytics From Strategic Planning to Enterprise Integration with Tools, Techniques, NoSQL, and Graph. Elsevier. Lamy, O. (2023) Apache Ranger, Apache Software Foundation. Available at: https://ranger.apache.org/ (Accessed: 14 March 2024). Mohmad, P. (2022). Relationship Between Big Data and Machine Learning Explained. Analytics Insight. https://www.analyticsinsight.net/relationship-betweenbig-data-and-machine-learning-explained/


169 Mittelstadt, B. D., Allo, P., Taddeo, M., Wachter, S., & Floridi, L. (2016). The ethics of algorithms: Mapping the debate. Big Data & Society, 3(2), 1–21. https://doi.org/10.1177/2053951716679679 Manyika, J., Chui, M., Brown, B., Bughin, J., Dobbs, R., Roxburgh, C., & Byers, A. H. (2011). "Big data: The next frontier for innovation, competition, and productivity." McKinsey Global Institute. Mittelstadt, B. D., & Floridi, L. (2016). The ethics of big data: Current and foreseeable issues in biomedical contexts. Science and Engineering Ethics, 22(2), 303–341. https://doi.org/10.1007/s11948-015-9652-2 MapReduce Tutorial. (2008). Available at: https://hadoop.apache.org/docs/r3.3.6/. Mayer-Schönberger, V., & Cukier, K. (2013). Big Data: A Revolution That Will Transform How We Live, Work, and Think. Houghton Mifflin Harcourt. Mittelstadt, B. D., & Floridi, L. (2016). "The Ethics of Big Data: Current and Foreseeable Issues in Biomedical Contexts." Science and Engineering Ethics, 22(2), 303- 341. Macrina, F. L. (2015). "Ethics of Big Data: Balancing Risk and Innovation." Information Science Reference. Ma, L., Gu, L., Li, B., Ma, Y., Wang, J., 2015. An improved Kmeans algorithm based on mapreduce and grid. International Journal of Grid and Distributed Computing 8. https://doi.org/10.14257/ijgdc.2015.8.1.18 Moertini, V.S., Venica, L., 2017. Parallel K-means for big data: On enhancing its cluster metrics and patterns. J Theor Appl Inf Technol 95.


170 - Moertini, V.S., Venica, L., 2016. Enhancing parallel k-means using map reduce for discovering knowledge from big data, in: Proceedings of 2016 IEEE International Conference on Cloud Computing and Big Data Analysis, ICCCBDA 2016. https://doi.org/10.1109/ICCCBDA.2016.7529538 My Skill (2023) Exploratory Data Analysis: Data Visualization & Correlation, Medium. Available at: www.medium.com (Accessed: 15 March 2024). Mariani, M.C., Tweneboah, O.K. and Beccar-Varela, M.P. (2021) Data Science in Theory and Practice: Techniques for Big Data Analytics and Complex Data Sets. Hoboken: John Wiley and Sons, Inc. Marr, B., 2016. Big Data in Practice. 1st penyunt. s.l.:Wiley. Marr, B., 2016. Big Data in Practice: How 45 Successful Companies Used Big Data Analytics to Deliver Extraordinary Results. Wiley. https://bernardmarr.com/wpcontent/uploads/2022/05/Big-Data-Esampler-1.pdf Mayer-Schönberger, V. and Cukier, K., 2014. Big Data: A Revolution That Will Transform How We Live, Work, and Think. American Journal of Epidemiology, 179(9), pp.1143–1144. https://doi.org/10.1093/AJE/KWU085. N[\cf[b [h^ Sohch^si, W.D. (2019) ‘Cihnliffcha mi`nq[l_ _pifoncih jli]_mm omcha ]i^_ mg_ff pcmo[fct[ncih’, ch ACM International Conference Proceeding Series.


171 Association for Computing Machinery, pp. 51–54. Available at: https://doi.org/10.1145/3341016.3341026. Nancy Lynch et al (2000) Bl_q_l’m Tb_il_g \s Pli`. Elc] Bl_q_l. Available at: http://www.cs.berkeley.edu/~brewer/cs262b2004/PODC -keynote.pdf. Oluleye, A. (2023). Exploratory Data Analysis with Python Cookbook (1st Editio). Packt Publishing. Ohm, P. (2010). Broken Promises of Privacy: Responding to the Surprising Failure of Anonymization. UCLA Law Review, 57, 1701. P[mm[l_ff[, R., Tbilck, M.D.B. [h^ Nolg[chc, S. (2021) ‘^[n[ [h[fcnce’. Peter K. Ghavami, P. (2016) BIG DATA GOVERNANCE: Modern Data Management Principles for Hadoop, NoSQL & Big Data Analytics. CreateSpace Independent Publishing Platform. Pemawat, V. (2023) Spark with YARN: Flow of Execution, medium.com. Available at: https://medium.com/@vivekpemawat/spark-with-yarnand-flow-of-execution-32cfaf2c6424 (Accessed: 27 February 2024). P. Pl_^cenc`, ‚Eemjfil[mc M_ni^_ P_haif[b[h Bca D[n[ Uhnoe P_gi^_f[h Pl_^cenc`,‛ pif. 7, jj. 1353–1360, 2024.


172 - Pasquale, F. (2015). "The Black Box Society: The Secret Algorithms That Control Money and Information." Harvard University Press. Priambodo, B., Jumaryadi, Y., Rahayu, S., Ani, N., Ratnasari, A., Salamah, U., Putra, Z. P., & Otong, M. (2022). Predicting Employee Turnover in IT Industries using Correlation and Chi-Square Visualization. International Journal of Advanced Computer Science and Applications (IJACSA), 13(12), 71–75. Sadalage, P. and Fowler, M. (2012) NoSQL Distilled: A Brief Guide to the Emerging World of Polyglot Persistence, Vasa. Addison-Wesley Professional. Sullivan, D. (2015) NoSQL for Mere Mortals. Michigan: AddisonWesley Professional. Santoso, J.T. (2020) ANALISIS BIG DATA. Yayasan Prima Agus Teknik. Schmarzo, B., 2013. Big Data: Understanding How Data Powers Big Business. Semantic Scholar. https://www.progress.com/docs/default-source/defaultdocument-library/Progress/Documents/bookclub/BigDataPowersBigBusiness.pdf Schneider, R.D. (2012) Hadoop for Dummies, Special Edition. Canada: John Wiley & Sons. S. S_jn[ [h^ H. Hiclof, ‚P_l[h Bca D[n[ j[^[ S_enil Ih^omnlc Perdagangan: Tinjauan Literatur pada Perusahaan Bc^[ha P_le[hnil[h,‛ J. O``. A^g. E^o]. Pl[]t., vol. 2, no. 3, pp. 198–210, 2022, doi: 10.26740/joaep.v2n3.p198-


173 210. Taylor, L., Floridi, L., & van der Sloot, B. (2017). Group privacy: New challenges of data technologies. Philosophy & Technology, 30(4), 419–425. https://doi.org/10.1007/s13347-017-0283-5 Tukey, J. W. (1977). Exploratory Data Analysis. Addison Wesley. The Apache Software Foundation (2021) Apache Oozie Workflow Scheduler for Hadoop. Available at: https://oozie.apache.org/ (Accessed: 10 March 2024). The Apache Software Foundation (2023) Aj[]b_ M[bion Um_l’m Guide, The Apache Software Foundation. Available at: https://mahout.apache.org/documentation/users/ (Accessed: 10 March 2024). Ting, K. and Cecho, J.J. (2013) Apache Sqoop Cookbook. O’R_cffs. V. F_l^c[hms[b, M. Ilq[h, [h^ P. N[moncih, ‚P_h_l[j[h Teknologi Big Data Dalam Pengembangan Database P_h^c^ce[h,‛ J. Rcm. M[h[d., pif. 1, hi. 3, jj. 22–29, 2023, [Online]. Available: https://doi.org/10.54066/jurma.v1i3.591.VázquezIngelmo, A. et al. (2024) ‘D[n[ pcmo[fct[ncih [h^ ^ig[ch knowledge: Insights through focus groups of l_m_[l]b_lm ch Sj[ch’, Computers in Human Behavior, 155, p. 108162. Available at: https://doi.org/10.1016/j.chb.2024.108162. White, T. (2015) Hadoop The Definitive Guide, Storage and Analysis at Internet Scale 4th Edition. 4th Edition. O’R_cffs.


174 - Wiese, L. (2015) Advanced Data Management: For SQL, NoSQL, Cloud and Distributed Databases. Warren, J. and Marz, N., 2015. Big Data: Principles and best practices of scalable realtime data systems. https://ieeexplore.ieee.org/document/10279852 Wang, L., & Alexander, C. A. (2016). Machine learning in big data. International Journal of Mathematical, Engineering and Management Sciences, 1(2), 52–61. https://doi.org/10.33889/ijmems.2016.1.2-006 Y[^[p, Rcmbc, ‚Aj[]b_ Sj[le 2.r Ciie\iie‛ Zhao, W., Ma, H., He, Q., 2009. Parallel K-means clustering based on MapReduce, in: Lecture Notes in Computer Science (Including Subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics). https://doi.org/10.1007/978-3-642-10665-1_71 Zhou, L., Pan, S., Wang, J., & Vasilakos, A. V. (2017). Machine learning on big data: Opportunities and challenges. Neurocomputing, 237, 350–361. https://doi.org/10.1016/j.neucom.2017.01.026 https://www.analyticsvidhya.com/blog/2022/09/working-withdataframes-using-pyspark/ https://spark.apache.org/docs


175 Nindy Irzavika, lahir di Padang Panjang, sebuah kota kecil di Sumatera Barat, Indonesia. Penulis menyelesaikan pendidikan sarjana di Universitas Andalas, program studi Sistem Informasi pada tahun 2015. Kemudian melanjutkan pendidikan dengan meraih gelar magister di Institut Teknologi Bandung (ITB), program studi Informatika pada tahun 2019. Selama kariernya, penulis pernah bekerja sebagai seorang analyst di WallStreetDocs, sebuah perusahaan internasional yang berbasis di London dan berfokus pada otomatisasi dokumen. Namun, saat ini, penulis bekerja sebagai seorang dosen di Universitas Pembangunan Nasional Veteran Jakarta (UPNVJ). Laina Farsiah adalah seorang dosen muda di Jurusan Informatika, Fakultas MIPA, Universitas Syiah Kuala. Laina meraih gelar Sarjana pada Jurusan Matematika, Fakultas MIPA, Universitas Syiah Kuala Tahun 2012 dengan fokus penelitian pada bidang Data


176 - Mining. Kemudian menyelesaikan pendidikan Magister (S2) di National Tsing Hua University (NTHU) di Hsinchu, Taiwan pada tahun 2015 dengan spesialisasi di bidang Computer Science . Selain mengajar di kampus, Laina juga aktif sebagai chmnloenol ‚Bca D[n[ omcha Psnbih‛ j[^[ jlial[g Fl_mb Graduate Academy (FGA) - Digital Talent Scholarship (DTS) yang diselenggarakan oleh Kementerian Komunikasi dan Informatika setiap tahunnya. Keahlian dan minatnya mencakup bidang Data Mining, Machine Learning, Computer Vision, Sentiment Analysis, dan Speech Recognition. Laina saat ini mengajar beberapa mata kuliah, termasuk Data Mining, Image Processing, Computer Vision, Programming Language, Data Structures and Algorithms, dan Data Visualization. Dengan latar belakang pendidikan dan pengalaman yang terintegrasi, kontribusinya dalam dunia akademis membawa wawasan yang mendalam dalam pengembangan ilmu dan teknologi informatika. Nova Tri Romadloni, M.Kom. Lahir pada tahun 1996 di Kabupaten Karanganyar, Jawab Tengah. Bekerja sebagai seorang Dosen tetap pada Prodi Informatika, Fakultas Sains dan Teknologi, Universitas Muhammadiyah Karangayar. Menyelesaikan studi D3 dengan program studi Manajemen Informatika di Universitas Bina Sarana Informatika. Dimana pada saat menjadi mahasiswa mulai semester 4 menjadi Asistan Lab selama 2 Tahun. Kemudian melanjutkan S1 dengan program studi Sistem Informasi dan Melanjutkan S2 dengan program studi Ilmu


177 Komputer pada Universitas Nusa Mandiri Jakarta, yang Lulus pada tahun 2019 dengan konsentrasi Data Mining. Mata kuliah yang pernah diampu diantara lain, Logika Informatika, Praktikum Algoritma dan Struktur Data, Sistem Basis Data, Praktikum Sistem Basis Data, Pengenalan Web, Praktikum Pengenalan Web, Information Retrieval dan lainnya . Rahmatika Pratama Santi, M.T merupakan seorang wanita yang berprofesi sebagai Tenaga Pendidik di Universitas Andalas sejak tahun 2018. Menempuh Pendidikan S1 di Universitas Andalas pada Departemen Sistem Informasi sejak tahun 2011 hingga 2015 dan dilanjutkan dengan S2 di Institut Teknologi Bandung sejak 2016 hingga 2018 pada bidang Teknik Informatika dengan konsenterasi keilmuan yaitu Business Intelligence. Nabilah, S.Kom., MT. Penulis berasal dari Kota Sabang. Menempuh pendidikan sarjana di Institut Teknologi Sepuluh Nopember jurusan Teknik Informatika, dan menyelesaikan studi masternya di Institut Teknologi Bandung jurusan Informatika. Saat ini menjadi Dosen di Fakultas Ekonomi dan Bisnis Universitas Syiah Kuala. Memiliki ketertarikan penelitian di bidang Digital Marketing, Augmented Reality di bidang pariwisata, dan Visualisasi Data.


178 - Ani Anisyah lahir di Kota Cimahi, Jawa Barat. Saat ini penulis merupakan Dosen Tetap program studi Ilmu Komputer Universitas Pendidikan Indonesia. Penulis menempuh pendidikan Sarjana Pend. Ilmu Komputer di Universitas Pendidikan Indonesia dan Magister Informatika di Institut Teknologi Bandung. Selama kariernya, penulis pernah bekerja sebagai webdeveloper, analyst, dan junior project manager untuk sebuah perusahaan IT consultant di kota Bandung yang bermitra dengan perusahaan BUMN. Sebagai seorang dosen penulis tertarik pada riset bidang software and engineering, big data, natural language processing, basis data non-relasional, dan business intelligence. Khairun Amala, atau kerap disapa Yuyun, lahir di Aceh Utara 25 November 1988. Ia menyelesaikan Sarjana di Jurusan Matematika dengan konsentrasi bidang Statistika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Syiah Kuala. Usai menyelesaikan studi S1-nya, Khairun bekerja sebagai Data Analyst di BPS Provinsi Aceh dan menlanjutkan berkarir sebagai Marketing Manager di salah satu lembaga pendidikan ternaman di Aceh. Tahun 2021 ia menyelesaikan studi magister di Magister Manajemen, Fakultas Ekonomi dan Bisnis, Universitas Indonesia dengan Peminatan Keuangan. Setelah lulus studi magister, ia mengajar di sebagai Dosen Luar Biasa di Prodi


179 Teknologi Informasi, Fakultas Sains dan Teknologi UIN ArRaniry (Februari 2022 – Juli 2024). Pada Maret 2024, Khairun diangkat menjadi dosen tetap di Jurusan Ekonomi Manajemen pada Fakultas Ekonomi dan Bisnis Universitas Syiah Kuala, Banda Aceh. Penulis dapat dihubungi melalui email: khairunamala11@ gmail.com. Nisa Dwi Angresti merupakan alumni Sarjana Sistem Informasi Universitas Andalas, Padang tahun 2016 dan Magister Sistem Informasi Institut Teknologi Sepuluh Nopember, Surabaya tahun 2019. Saat ini Nisa mengajar di Telkom University Jakarta pada Program Studi Sistem Informasi. Bidang penelitian yang diminatinya meliputi basis data, business intelligence, dan big data. Untuk kritik dan saran yang membangun dapat disampaikan melalui email [email protected]. Nisa juga dapat dihubungi melalui media sosial Instagram @nisundwi. Dwina Satrinia, lahir di Bandung, Jawa Barat. Gelar Sarjana Komputer (S.Kom.) didapatkannya dari Program Studi Ilmu Komputer, Universitas Brawijaya (saat ini Program Studi tersebut Bernama Sistem Informasi). Penulis melanjutkan studinya pada Program Pascasarjana di Institut Teknologi Bandung pada Program Studi Informatika dan mendapatkan gelar Magister Teknik (M.T.) pada tahun 2017.


180 - Penulis memulai karir sebagai Programmer, kemudian sebagai staff IT serta System Analis pada Perusahaan Konsultan IT di Kota Jakarta dan Bandung. Penulis juga pernah menjadi instruktur Pemrograman di Sekolah Vokasi di Bandung. Pada tahun 2021, Penulis berganti karir menjadi dosen yang sampai saat ini masih aktif di Universitas Telkom Jakarta. Bagi para pembaca dapat menghubungi penulis lebih jauh melalui email: [email protected]. Yuwan Jumaryadi. Penulis menyelesaikan Pendidikan S1 pada jurusan Teknik Informasi di Universitas Bina Nusantara pada 2010, kemudian menyelesaikan Pendidikan S2 pada jurusan Manajemen di Universitas Mercu Buana pada 2014, dan Setelah itu menyelesaikan Pendidikan S2 pada jurusan Ilmu Komputer di Universitas Budi Luhur pada 2023. Saat ini penulis juga aktif sebagai reviewer dan editor di beberapa Jurnal Nasional. Deosa Putra Caniago, S.Kom., M.Kom. Lahir di Bengkulu dan menyelesaikan pendidikan terakhirnya dalam bidang Magister Komputer di Universitas Putra Indonesia YPTK Padang pada tahun 2020. Minat penelitiannya berfokus pada Artificial Intelligence (AI), Embedded System, Robotics, dan Data Mining. Pengalaman profesionalnya termasuk terpilih Hibah Ristekdikti PDP (2022 & 2023). Hibah PKM Ristekdikti (2023).


181 Aktif dalam publikasi jurnal terakareditasi sinta. Mengajar di Program Studi Teknik Komputer, menjadi Koordinator laboratrium elektronika serta pembina UKM Robotika ITEBA. Luki Hernando, M.Kom, Lahir di Kampung Tangah, Pendidikan terakhir Teknik Informatika (S2) ^[lc Uhcp_lmcn[m Pon_l[ Ih^ih_mc[ (‚UPI YPTK‛) P[^[ha. M_ha[\^c m_\[a[c ^im_h Dc Fakultas Teknologi Informasi Institut Teknologi Batam di program studi Teknik Komputer semenjak tahun 2018. Minat penelitian di bidang software enginering. Mengingat tantangan dan ketidakpastian yang harus saya hadapi. Namun, kecintaan saya terhadap dunia literasi dan keinginan untuk berbagi cerita dengan pembaca menjadi pendorong utama saya. Buku pertama kali yang saya tulis berjudul Membuat Poster Digital Dengan HP & PC. Liptia Venica, S.T., M.T. adalah seorang dosen tetap di program studi Mekatronika dan Kecerdasan Buatan Universitas Pendidikan Indonesia dengan fokus bidang ilmu Machine Learning, Big Data, Cloud Computing, dan UX. Menyelesaikan pendidikan S1 di program studi Teknik Informatika, Universitas Katolik Parahyangan pada 2016. Kemudian melanjutkan pendidikan S2 pada tahun 2018 hingga 2020 di program studi Magister Informatika, Institut Teknologi Bandung dengan fokus bidang Business Intelligence. Contact person dapat menghubungi melalui email [email protected].


182 -


Click to View FlipBook Version