Herkese merhaba sizlere makine öğrenmesini giriş seviyesinde anlatacağım. Beraber keyifli bir yolculuk yapacağız. Hazırsanız başlayalım.
Makine öğrenmesi bilgisayarların insanlara benzer şekilde yapılan hareket ve düşünülen düşüncelerin öğrenmesini sağlamak amacıyla programlama dilleri aracılığıyla çeşitli algoritma ve tekniklerin geliştirilmesi için çalışılan bilimsel alandır. Bir diğer bakış açısıyla baktığımızda şunları da eklemek yanlış olmaz.
Makine öğrenmesi geçmişteki verilere bakarak verinin özütünü çıkarmaktır diyebiliriz.
Günlük yaşamımıza baktığımızda makine öğrenmesi hayatımızın her alanında bizleri ürün olarak karşılıyor. Gelecek robot ve akıllı cihazların üstüne kurulu bu da bizi daha bilgili kılmak zorunda. Bunlardan birkaçını sizlerle paylaştıktan hemen sonra makine öğrenmesine giriş yapacağız.
Uber, yolcularının sarhoş olup olmadığını ölçen uygulama yaptı.
Yapay zeka hayatımızın birçok demek çok doğru bir cümle oldu. Belki de ileride bir restoran da oturup robotların çaldığı müzikleri dinleyeceğiz.
Bağımlı Değişken: Tahminlerimize dayalı olarak bulmak istediğimiz ana değişken. Farklı kaynaklarda aşağıdaki kavramlar görülmektedir.
- Target (Yaygın Kullanılır)
- Dependent
- Output
- Response
Bağımsız Değişken: Ana değişkeni bulmamızı sağlayan değişken. Farklı kaynaklarda aşağıdaki kavramlar görülmektedir.
- Feature (Yaygın Kullanılır)
- Input
- Column
- Predictor
- Explanatory
Gözetimli Öğrenme(Supervised Learning):
Gözetimli öğrenme A girdi kümesinden istenen, B çıktı kümesinin elde edilmesi için bir fonksiyon öğrenmesidir. Şöyle size normal yaşamdan örnek verecek olursam marketten hazır paketlerde satılan tatlı aldınız. Kutunun arkasında katılması gereken malzemeleri aldınız ve eve gittiniz. Arkadaki tarife göre malzemelerinizi katıp tatlınızı karıştırdınız ve fırına attınız. Tatlınız hazır. Bu örnek bize ne demek istiyor? Benzetme yapacak olursak malzemeler bizim verilerimiz hiçbiri tatlımız için ayrı ayrı bir şey ifade etmeyecektir. Kutunun arkasında tarifimiz var biz bu tarifi bilmesek bir tatlı yapamayacaktık. Tatlıyı yapan kendinizi bir makine, malzemeleri veriler yerine ,tarifi model yerine koyun. Kısaca bağımlı ve bağımsız değişkenlerin bir arada olduğu öğrenme çeşididir diyebiliriz.
Gözetimsiz Öğrenme(Unsupervised Learning):
Girdilerin bir arada olduğu öğrenme çeşididir. Veriler kümelenir ve bu kümelere göre sınıflandırılır. Gözetimli öğrenmeden farklı olarak kümeleme işlemini uzaklık tabanlı gerçekleştirir.
Yarı Gözetimli Öğrenme:
Büyük miktarda etiketlenmiş veri ile az miktarda etiketlenmiş veri grubudur. Yani gözetimli ve gözetimsiz öğrenmenin arasındadır.
Regresyon(Regression)Problemleri
Bağımlı değişkenin alacağı değerleri sayısal olarak belirleyen problem tipidir.
Sınıflandırma(Classification)
Kategorik değişkenlerden oluşan veri kümesidir.
Bir makine öğrenmesi modelini nedene eğitiriz ? Buna yakından bakabilmek için insanın nasıl öğrendiğine odaklanmak gerekebilir. Geçmiş deneyimlerinden model oluşturarak gelecek deneyimleri şekillendirir. Benzer şekilde makine öğrenmesi modeli, elimizde bulunan geçmiş verilere bakarak gelecekte oluşabilecek verileri tahmin edebilmek veya kümeleyebilmek amacıyla oluşturulur. Buna bir örnek vermek istersek bir e-postanın spam olup olmadığını tahmin etmek için bir ML modelinin eğitilmesi fikri olabilir.
Bir sonraki makine öğrenmesi yazımda görüşmek üzere…
https://www.udemy.com/user/mustafa-vahit-keskin/ (dsbootcamp)
https://www.analyticsvidhya.com/blog/2018/04/fundamentals-deep-learning-regularization-techniques/.
https://towardsdatascience.com/understanding-auc-roc-curve-68b2303cc9c5.