Naive Bayes algoritması, sınıflandırma işlemlerinde kullanılan olasılık esaslı bir makine öğrenme modelidir. Algortima olasılıkları hesaplar ve olasılığı yüksek olan duruma göre sınıflandırmaları gerçekleştirir. Bu sınıflandırma modeli Bayes teoremine dayanır.
Bu teorem bir sonucun sebebini bulurken sonucun hangi olasılıkla hangi sebepten kaynaklandığını bulmaya yardımcı olur. Formülü inceleyecek olursak;
P ( A | B ) = B olayına bağlı olarak A olayının gerçekleşme olasılığı
P ( A ) = A olayının gerçekleşme olasılığı
P ( B | A ) = A olayına bağlı olarak B olayının gerçekleşme olasılığı
P ( B ) = B olayının gerçekleşme olasılığı
Algoritma şu şekilde çalışır;
Bir veri için karşılaşabileceği her durumun olasılığı hesaplanarak en yüksek çıkan olasılık değerine göre sınıflandırılır. Test kümesinde olup eğitim kümesinde olmayan bir değer varsa , bu değerin olasılık değeri 0 olur yani bir tahmin yapılamaz. Bu durum Zero Frequency ( Sıfır Frekans ) olarak bilinir. Bu durumu çözmek için düzeltme teknikleri kullanılabilir.
Python ile Naive Baves