Berdasarkan Gambar 3.2 terlihat lebih detail, disini kita dapat
mengetahui pengeluaran dan pendapatan dari laki-laki begitu juga
pengeluaran dan pendapatan dari perempuan. Dan masih banyak lagi
tipe-tipe yang bisa kita kombinasikan dalam membuat visualisasi
dalam bentuk grafik plot atau Scatter Plot.
4.2 Grafik Garis (Line)
Grafik garis (plot garis atau bagan garis) adalah jenis grafik yang
menggambarkan hubungan beberapa data dalam bentuk garis atau
kurva. Sama halnya dengan scatter plot, fungsi yang digunakan untuk
membuat grafik garis adalah plot() dan lines(). Kita juga bias
menampilkan beberapa grafik garis dalam 1 plot. Perhatikan kasus di
bawah ini.
Pada kasus ini, kita ingin melihat perkembangan penjualan
beberapa jenis mobil (Mobil A, Mobil B, Mobil C) dari tahun 2000-2010.
Karena pada kasus ini terdapat 3 jenis mobil yang ingin dilihat, maka
akan kita tampilkan grafik garisnya dalam 1 plot.
Tabel 4.2 Data Penjualan Mobil A, Mobil B, dan Mobil C
Tahun Mobil A Mobil B Mobil C
2000 5 7 10
2001 6 8 12
2002 8 10 12
2003 9 13 14
2004 12 16 17
2005 15 19 20
2006 19 19 24
2007 20 24 28
2008 23 26 29
2009 26 29 31
2010 28 30 33
Berikut perintah yang dapat kita gunakan.
data_grafik <- read_excel("D:/PNS UNIMED/CPNS/LATSAR 2022/03
AKTUALISASI/Data grafik.xlsx ")
total<-data_grafik$`Mobil A`
plot.new()
46
plot(data_grafik$Tahun, total, type=”o”, col=”red”, ylim=c(2,35)
lty=23, pch=22, xlab=”Tahun”, ylab=”Total Penjualan”)
lines(data_grafik$Tahun, data_grafik$`Mobil B`, type=”o”,
col=”blue”, lty=23)
lines(data_grafik$Tahun, data_grafik$`Mobil C`, type=”o”,
col=”black”, lty=23)
legend(2000, 35, c(“Mobil A”, “Mobil B”, “Mobil C”, cex=0.8,
col=c(“red”, ”blue”, ”black”), lty=80)
title(main=”Penjualan Mobil A, B, C dari Tahun 2000-2010”,
col.main=”Black”, font.main=3)
Gambar 4.3 Grafik Garis Penjualan Mobil A, B, C
Berdasarkan Gambar 3.3, kita dapat melihat data penjualan
Mobil A, Mobil B, dan Mobil C dalam 1 plot. Selain itu, setiap grafik
diberi warna yang berbeda. Hal ini juga memudahkan pembaca dalam
menafsirkan sebuah grafik.
4.3 Grafik Batang (Bagian Pertama)
Diagram batang atau grafik batang adalah salah satu penyajian
data dalam bentuk batang atau persegi panjang. Panjang pendeknya
batang dalam diagram batang ditentukan oleh jumlah nilai dari data
yang ada. Diagram batang biasanya digunakan untuk melihat
perkembangan nilai dari suatu data dalam jangka waktu tertentu.
Diagram batang dapat ditampilkan secara vertical maupun horizontal.
Intinya, ketika kita menyajikan visualisasi data diharapkan mudah
47
dipahami oleh pembaca. Pada umumnya di R, fungsi yang digunakan
untuk membuat diagram batang adalam barplot().
Pada kasus ini masih menggunakan data penjualan Mobil A,
Mobil B, Mobil C. Berikut perintah yang digunakan.
barplot(data_grafik$`Mobil A`, data_grafik$Tahun,
main=”Penjualan Mobil A dari Tahun 2000-2010”,
xlab=”Tahun”, ylab=”Jumlah Mobil yang Terjual”,
names.arg=c(“2000”, “2001”, “2002”, “2003”, “2004”,
“2005”, “2006”, “2007”, “2008”, “2009”, “2010”))
Gambar 4.4 Barplot Penjual Mobil A dari Tahun 2000-2010
Berdasarkan Gambar 3.4 dapat dilihat data penjualan Mobil A
dari tahun 2000-2010, dimana setiap tahun mengalami kenaikan
penjualan. Diagram batang pada kasus tersebut penyajian
visualisasinya dari 1 data saja. Namun pada diagram batang juga bias
menyajikan lebih dari 1 data.
4.4 Grafik Batang (Bagian Kedua)
Pada kasus yang kedua ini, kita ingin melihat hobi siswa laki-laki
dan perempuan di Universitas ABC (data terlampir). Pada perintah ini,
menggunakan library {ggplot2}. Perhatikan perintah di bawah ini:
data_batang <- read_excel("D:/PNS UNIMED/CPNS/LATSAR 2022/03
AKTUALISASI/Data grafik batang.xlsx ")
Jenis_Kelamin <- data_batang$`Jenis Kelamin`
jumlah <- data_batang$Jumlah
hobi <- data_batang$Hobi
48
ggplot(data=data_batang, aes(x=hobi, y=jumlah,
fill=Jenis_Kelamin)) + geom_bar(stat=”identity”) +
xlab(“Hobi Mahasiswa”) + ylab(“Jumlah Mahasiswa”) +
ggtitle(“Universitas ABC”) + geom_text(aes(y=jumlah/1.2,
label=jumlah), position=”stack”)
Gambar 4.5 Barplot Hobi Mahasiswa Laki-laki dan Perempuan di
Universitas ABC (a)
Berdasarkan Gambar 3.5 dapat dilihat pada masing-masing hobi
terdapat data mahasiswa laki-laki dan perempuan dengan dibedakan
warnanya. Warna merah muda untuk laki-laki dan warna biru untuk
perempuan. Namun untuk pewarnaan ini bias diatur oleh programmer.
Selain itu dengan data yang sama dapat disajikan dengan diagram
yang berbeda. Perhatikan perintah di bawah ini.
ggplot(data=data_batang, aes(x=hobi, y=jumlah,
fill=Jenis_Kelamin)) + geom_bar(stat=”identity”,
position=position_dodge()) + xlab(“Hobi Mahasiswa”) +
ylab(“Jumlah Mahasiswa”) + ggtitle(“Universitas ABC”) +
geom_text(aes(y=jumlah/1.5, label=jumlah),
position=position_dodge(width=1))
49
Gambar 4.6 Barplot Hobi Mahasiswa Laki-laki dan Perempuan di
Universitas ABC (b)
Berdasarkan Gambar 4.6 sama seperti diagram batang
sebelumnya. Hanya saja pada penyajian ini data laki-laki dan
perempuan tidak digabung pada 1 batang atau persegi Panjang.
Namun masing-masing dipisah berdasarkan hobi (Membaca dan
Olahraga).
4.5 Diagram Lingkaran (Pie Chart)
Diagram lingkaran atau Pie Chart adalah penyajian data yang
berbentuk lingkaran yang dibagi menjadi irisan-irisan untuk
menggambarkan proporsi numerik. Di R untuk menampilkan
penyajian data dengan diagram lingkaran dapat menggunakan fungsi
pie() dan dapat mengaktifkan beberapa library. Pada kasus ini, kita
ingin melihat data pengguna Hp dari berbagai merk (Iphone,
Samsung, Vivo dan Oppo).
Tabel 4.3 Data Pengguna Hp
Merk Hp Jumlah
Iphone 20
Samsung 45
Vivo 35
Oppo 60
50
Perhatikan perintah berikut ini.
# Mengaktifkan beberapa library yang diperlukan
library(grid)
library(gridExtra)
library(scales)
data_batang <- read_excel("D:/PNS UNIMED/CPNS/LATSAR 2022/03
AKTUALISASI/Data DLingkaran.xlsx ")
pie(data_DLingkaran$Jumlah, labels=data_DLingkaran$Julmah,
main=”Data Pengguna Merk Hp”, col=heat.cplors(4))
legend(1.5, 0.4, c(“Iphone”, “Samsung”, “Vivo”, “Oppo”),
cex=0.9, fill=heat.colors(4))
Gambar 4.7 Diagram Lingkaran Pengguna Merk Hp
Berdasarkan Gambar 4.7 dapat dilihat masing-masing proporsi
pengguna merk Hp. Selain itu juga pewarnaan diagram lingkaran bias
diatur sesuai keinginan.
4.6 Histogram
Histogram adalah representasi grafis (diagram) yang mengatur
dan menampilkan frekuensi data sampel pada rentang tertentu.
Frekuensi data yang ada pada masing-masing kelas
direpresentasikan dengan bentuk grafis diagram batang atau kolom.
Di R untuk menyajikan histogram dapat menggunakan fungsi hist().
Pada kasus ini kita akan menyajikan data IQ pasien di salah satu RS
ABC (data terlampir). Perhatikan perintah berikut ini.
data_histogram <- read_excel("D:/PNS UNIMED/CPNS/LATSAR 2022/03
AKTUALISASI/Data Histogram.xlsx ")
51
data_iq <- data_histogram$IQ
hist(data_iq, main=”Data IQ Di RS ABC”,
xlab=”IQ”, ylab=”Frekuensi”)
Gambar 4.8 Histogram Data IQ Sederhana
Berdasarkan Gambar 4.8 adalah penyajian histogram yang
sederhana, tanpa diatur warna dari masing-masing batangnya. Berikut
dengan menggunakan data yang sama namun penyajiannya
histogramnya dimodifikasi.
hist(data_iq, col=heat.colors(6), ylim=c(0,30),
main=”Data IQ Di RS ABC”, xlab=”IQ”, ylab=”Frekuensi”,
breaks=c(90, 95, 100, 105, 110, 115, 120), xlim=c(90,125))
Gambar 4.9 Histogram Data IQ yang Sudah Dimodifikasi
52
Berdasarkan Gambar 4.9 dapat dilihat masing-masing diagram
batang memiliki warna yang berbeda-beda. Hal ini juga memudahkan
pembaca dalam memahami histogram dan juga tampilannya lebih
menarik.
Dalam menyajikan atau membuat visualisasi data, harus kita
sesuaikan dengan data. Pilihlah penyajian data yang mudah dipahami
pembaca bahkan orang awam dengan statistika. Selain itu sajikan
data dengan tampilan semenarik mungkin, karena di R sangat banyak
menyediakan fitur-fitur untuk kita berekspresi mulai dari jenis tulisan
hingga pewarnaan pada output visualisasi data.
53
DAFTAR PUSTAKA
Bramer, Max. 2007. Principles of Data Mining. Springer.
Gio, P.U. dan Irawan, D. E. 2016, Belajar Statistika dengan R. USU Press.
Gorunescu, Florin. 2011. Data Mining, Concepts, Models, and Techniques.
Springer.
Hermawati, F. A. 2013. Data Mining. Penerbit Andi
R Core Team. 2020. R: A Language and Environment for Statistical
Computing. Vienna, Austria: R Foundation for Statistical
Computing. https://www.R-project.org/.
Suhartono. 2008. Analisis Data Statistika dengan R. ITS Surabaya.
Wickham, Hadley. 2015. Advance R. Boca Raton, Florida: Chapman;
Hall/CRC. http://adv-r.had.co.nz/.
http://cran.r-project.org/web/packages/rpart/rpart.pdf
https://cran.r-project.org/web/packages/rpart.plot/rpart.plot.pdf
https://cran.r-project.org/web/packages/caret/caret.pdf
http://www.milbo.org/rpart-plot/prp.pdf
54