Morning, Nice day for coding ain’t it? Huu-Haa.
Pada artikel sebelumnya, sepupu kita menerapkan cara yang sama dengan bagaimana machine learning bekerja. Kali ini kita akan mendekatkan diri kita dengan data untuk mengetahui isi dari data tersebut.
Langkah awal di tiap projek ML adalah membiasakan diri dengan data. Kita dapat menggunakan Panda library untuk hal ini. Panda adalah tools utama yang digunakan data saintis untuk mengeksplor dan memanipulasi data.
Kebanyakan orang menyingkat panda dalam kode mereka sebagai pd.
Seperti baris kode berikut:
import pandas as pd
Hal yang penting yang menjadi bagian Panda library adalah DataFrame. Didalamnya menyimpan berbagai tipe data mungkin terpikirkan bahwa DataFrame seperti sebuah tabel seperti sheet pada Excel atau tabel pada basis data SQL.
Pada Panda memiliki berbagai metode yang ampuh untuk sebagian besar hal yang ingin kita lakukan dengan jenis data ini
Sebagai permulaan, mari kita lihat pada data harga rumah di Melbourne, Australia.
kita akan memuat dan mengekslor data dengan perintah berikut:
# Menyimpan filepath kedalam variabel untuk akses yang mudah
melbourne_file_path =melbourne_file_path = ‘../input/melbourne-housing-snapshot/melb_data.csv’#Membaca data dan menyimpannya kedalam variabel dengan tipe #DataFrame yang diberi nama melbourne_data
melbourne_data = pd.read_csv(melbourne_file_path)# mencetak ringkasan data pada melbourne_data
melbourne_data.describe()