Hi,
It’s Hanamian.
You’re here to read my journey to learn Data Science from absolutely ZERO. Well, Aku juga belum tau kapan my Z bisa berubah jadi H. Let’s just enjoy the process and learn it together here!
Okay, this is exactly what I was thinking about when I wanna be a Data Scientist and curious about how they deal with their work. Pas mereka dapet task, langkah apa aja sih yang mereka lakuin? So, ini steps umum yang mereka lakuin.
- Merumuskan Pertanyaan
This is a basic thing we need to do as a Data Scientist. Why? Karena kalau kita merumuskan pertanyaan dengan benar, of course kita bisa nglakuin research dan ngumpulin data dengan benar juga. Misal: “Seberapa besar pengaruh durasi hari PSBB terhadap penurunan jumlah penderita baru Covid-19?”
In Data Science, that Question can be divided into two:
- Independent variable (Feature)= Data Durasi hari PSBB
- Dependent Variable (Target)= Data Jumlah penderita baru Covid-19
2. Ngumpulin Data
Ini bahan mentahnya. Kita perlu ngumpulin data yang sesuai sama apa yang kita butuhin. Balik lagi, step 1 kudu OK dulu, biar data yang kita kumpulin sinkron sama tujuan yang diminta. Here we also need to gather data untuk feature dan data untuk target.
3. Clean Your Data
Biasanya data yang kita kumpulin bentuknya awut-awutan, jadi perlu kita bersihin, rapiin, dan seragamin. Biar apa? biar enak diolah dan divisualisasi. Biasanya dalam proses cleaning data itu apa aja yang perlu dihandle? Ini:
- missing data
- error
- data yang formatnya beda dan penting banget buat disamain
4. Visualisasi Data
This step is fun, really! Data yang udah bersih perlu kita bikin visualisasinya dalam bentuk grafik atau diagram biar kita tau persebaran datanya gimana dan bisa dapet insight dari situ. However, jangan dibikin rumit sendiri. Pilih visualisasi yang paling sesuai yang kalau orang awam lihat bisa paham OR pas kamu lihat sendiri juga ga bikin pusing.
5. Train Your Data with Algorithm
Machine Learning Algorithm buat Data Science dibagi jadi 2, yaitu:
- Supervised Learning
- Unsupervised Learning
Pengelompokan dan contoh Algorithmnya ada di gambar bawah ini. Selain yang ada di gambar-gambar bawah ini, bisa lo kita gabungin 2 atau lebih Algorithm.
Sebenernya ada banyak algorithm di Data Science, tapi dari 844 voters di kdnuggets.com kita bisa liat 10 algorithm yang biasa dipake para Data Scientist.
Please let me know yah kalau kalian tau Algorithm apa aja yang biasa dipakai Data Scientist Indonesia
6. Evaluasi
Last step! Evaluasi seberapa akurat algoritma yang kamu pakai buat datamu. Kalo ga memuaskan hasilnya, kamu bisa pakai Algorithm lain dan bandingin hasilnya. Finally, tarik kesimpulan-kesimpulan penting dari hasil yang kamu dapetin. Good luck!