A.Perkakas Analisis Data
Analisis data mempunyai Teknik yang disebut sebagai scraping.Dalam hal ini scraping
sebagai salah satu bentuk penyalinan yaitu data tertentu dikumpulkan dan disalin dari
sebuah halaman web,basis data,spreadsheet hingga berbagai tampilan tertentu.Setiap
Bahasa pemrogaman bisa di implementasi oleh sebuah lingkungan pengembangan
terintegrasi.
1.Google Colaboratory (Google Colab)
Google Colab merupakan salah satu jenis aktivitas untuk memulai analisis data dan
pengembangan aplikasi yang terintegrasi. Google Colab disediakan oleh Google secara
online (Online IDE). digunakan untuk menulis program dan melakukan pengolahan data dari
internet. Google Colab dapat digunakan untuk membantu pengolahan data. Bisa juga
digunakan untuk melakukan scraping,dapat membangun aplikasi berbasis Deep Learning
menggunakan library yang populer seperti OpenCV, TensorFlow, dan PyTorch.
a.Pengaturan GPU dan Ruang Lingkup Google Colab
jika ingin menjalankan program Phyton dengan menggunakan GPU (atau bahkan
TPU),cukup klik edit>Notebook settings,lalu pada bagian Hardware Accelerator pilih GPU.
1.Pip Package Installation
Ketika menbutuhkan instal python package di colab
2.Pip Instal Seaborn
Perintah Pip instal seaborn sama seperti instalasi Pip pada umumnya hanya saja di awali
dengan tanda !.
b.Menghubungkan ke Google Drive
Google colab akan mereset notebook beserta seluruh temporary filmnya maksimal 12 jam
sekali.Karenanya akan lebih baik jika file yang akan digunakan atau dihasilkan tersimpan
dengan rapi di Google drive.Hal ini bisa dilakukan dengan menjalankan perintah sebagai
berikut
“from google.colab import drive drive.mount(‘/content/drive’)”
c.Mengupload file ke Colab
Mengupload langsung file yang diperlukan ke colab sebagai alternatif jika tidak ingin
menghubungkan Google Colab ke Google Drive.Menyediakan tempat penyimpanan file
sementara yang akan direstart (dihapus) dalam rentangan waktu tertentu.Adapun prosedur
upload file ke Google Colab
“from google.colab import file upload=files.upload ( )
d.Pengaturan Tema
Pengubahan tema dilakukan di Tools>Preferences>site.Selain itu colab juga menyediakan
beberapa hiburan lain untuk diatur.Fitur tersebut ditemukan di
Tools>Preferences>Miscellaneous.
2.Bahasa Pemrograman Python
Beberapa jeniş bahasa pemrograman yang dapat digunakan untuk membuat program
sebagai berikut.
a. Cetak data (print)
Output (keluaran) merupakan setiap informasi (nilai atau data) yang dikirimkan oleh mesin/
komputer kepada pengguna (manusia) setelah tahap pemrosesan tertentu. Python bersifat
case sensitive sehingga huruf kapital sangat diperhatikan. Terdapat berbagai jenis output
pada Python, namun yang paling dasar ada 2 jenis, yaitu output yang ditampilkan di layar
(CLI) dan output yang dikeluarkan (ditulis) dalam bentuk file. Secara umum, output bisa
berupa teks, gambar, suara, atau bahkan berupa informasi yang dicetak di atas kertas, dan
sebagainya. Fungsi print() digunakan untuk mencetak ouput program di layar. Untuk
membuat output di layar, perintah atau fungsi yang paling sering digunakan adalah fungsi
print( ).
b. Pemberian nilai data (assignment)
Pengisian atau pemberian nilai data disebut assignment (atau operator penugasan).
Operator assignment juga bisa dipakai bertingkat serta memiliki variasi penulisan yang
disebut sebagai operator assignment gabungan (compound assignment). Dalam hal ini,
operator assignment berkaitan dengan memasukkan suatu nilai ke dalam variabel. Operator
assignment dalam bahasa Python menggunakan tanda sama dengan (=). Pembacaan
operasi assignment dilakukan dari kanan ke kiri, bukan dari kiri ke kanan seperti yang biasa
memahaminya dalam matematika. Operator assignment gabungan adalah cara penulisan
singkat operator assignment yang digabung dengan dengan operator lain. Dalam bahasa
Python, operator assignment gabungan terdiri atas operator assignment dengan operator
lain seperti operator aritmatika dan bitwise.
c.Banyak Nilai untuk Satu Variabel (Array)
Ketika menyimpan data, kita melakukannya dengan satu nilai per variabel. Ketika kita
memasukkan ulang variabel dengan nilai yang berbeda, nilai sebelumnya akan
hilang/ditimpa dengan nilai tersebut. Menyimpan lebih dari satu nilai dalam satu variabel
bisa kita lakukan, hal tersebut disebut variabel array. Sebenarnya kita sering menemui data
yang memiliki banyak nilai di dalam kehidupan sehari- hari. Misalnya daftar nilai suatu mata
pelajaran di kelas.
d. Penelusuran data/pengulangan (loop: for)
Perulangan (loop) merupakan konsep pemrograman yang berguna untuk mengulang baris
perintah, salah satunya adalah perulangan menggunakan perintah FOR. Perulangan FOR
pada Python digunakan untuk melakukan iterasi dari sebuah nilai sequence (data koleksi)
pada Python seperti List, Tuple, String, dan lain-lain.Dengan perulangan, bisa mengeksekusi
suatu kode program berkali-kali dengan jumlah tertentu, atau selama sebuah kondisi
tertentu terpenuhi. For memiliki perilaku yang berbeda dengan FOR. Hal tersebut karena
pada Python, for sangat berkaitan dengan data sequence (data kolektif).
Komponen-komponen format perulangan FOR
-Sequence
-Nilai
-Blok Kode
1.Penggunaan For dengan list
Di awali dengan membuat sebuah variabel menggunakan tipe data list. Setelah itu,
menampilkan tiap item dari list yang telah buat.
2) Penggunaan For untuk urutan iterasi for dengan list
Guna mengetahui urutan iterasi for dengan list, bisa menggunakan fungsi enumerate.
Fungsi tersebut akan mengekstrak 2 buah nilai, yaitu index untuk urutan iterasi dan item
sebagai nilai dari list itu sendiri.
3) Penggunaan For dengan tuple
Tuple adalah tipe data yang bersifat iterable sehingga bisa diperlakukan sebagai objek
perulangan menggunakan for.
e. Uji kondisi (branch: try)
Salah satu bentuk penanganan di Python adalah menggunakan statement try..except.
Biasanya try..except digunakan untuk menangani saat penggunaan IO, operasi database,
atau pengaksesan indeks suatu list atau dictionary, dan berbagai kasus lainnya
F.Pustaka kode (library import)
Python dapat digunakan di berbagai sistem operasi seperti Windows OS, Mac OS, Linux OS,
dan lain-lain. Bahasa pemrograman Python juga didukung oleh banyak library yang gratis
(lebih dari 140.000 library yang dikembangkan melalui open source project dan digunakan
untuk membantu dalam mengolah atau mengerjakan task. Berbeda dengan bahasa
pemrograman lain.
1) Jenis library
Library merupakan sebutan untuk kode program tambahan yang digunakan untuk
kebutuhan tertentu. Python memiliki library yang sudah built-in, artinya library tersebut sudah
siap digunakan setelah Python telah terinstal. Beberapa built-in yang sering digunakan
csv,datetime,json,math,string
a).Matplotlib
Matplotlib merupakan jenis library yang paling sering digunakan oleh data science dalam
menyajikan datanya ke dalam visual yang lebih menarik. Data yang telah diolah akan
ditampilkan sejelas dan sebagus mungkin.
b) NumPy (Numerical Python)
Library yang pertama ini berfungsi untuk membantu para data scientist menangani
permasalahan angka (scientific computing). NumPy memudahkan penggunanya dalam
operasi Aljabar Linear seperti Vektor dan Matriks.
c.Pandas
Library Pandas berdasarkan sistem dataframe yang dapat memuat sebuah file ke dalam
tabel virtual menyerupai spreadsheet. Pandas juga berfungsi mengolah suatu data seperti
teknik join, distinct, group by, agregasi, dan teknik lainnya seperti pada
SQL.
2) Instalasi library
Terdapat 2 cara untuk menginstal library di Python, yaitu menggunakan PIP dan
menggunakan CONDA
a) Instalasi library dengan pip
Jika instalasi menggunakan anaconda maka pip bisa langsung digunakan. Pada saat
mengetik sintaks: pip di cmd/terminal dan keluar opsi perintah maka pip sudah berhasil
terinstal dengan baik. Selanjutnya, menggunakan pip untuk menginstal library adalah:
pip install <nama_library>. Misalnya, install library keras (untuk deep learning) dengan
perintah : pip install Keras.
b) Instalasi Library dengan Conda
Conda memberikan kemudahan dalam mengatur library, dependensi, dan lingkungan
pemrograman. Conda dapat digunakan langsung setelah melakukan instalasi Python
dengan anaconda. Di awali dengan mengetik sintaks conda di cmd/terminal sehingga keluar
opsi perintah yang artinya conda sudah berhasil terinstal dengan baik. Adapun cara
menginstal library conda adalah dengan périntah: conda install <nama_library>. Misalnya
ingin menginstal library keras dengan perintah : conda install -c anaconda Keras. Selain itu,
programmer bisa menentukan versi keras saat menginstal dengan perintah : conda install -c
anaconda Keras-2.3.1