Örnekleme Nedir ?
Örnekleme istatistikte kesin olarak belirlenmiş bir kütleden alınan kümeyi ifade eder. Örneğin; Türkiye’deki tüm fabrikalar bir kütle iken İstanbul daki fabrika sayısı bu kütleden alınmış bir örnektir.
En önemli özelliği temsili ve yansız olmasıdır. İnsanlar çoğu kez kararlarını alırken örneklemden yararlanırlar.
Neden Örneklem Önemlidir ?
Bilimsel araştırmalarda gerçek bilgi sahibi olmak ve dürüst karar vermek başlıca amacıdır. Toplumdan tamamından veya büyük bir kısmından veri elde etmek gerek ekonomik, gerekse zaman açısından olanaksızdır. Toplumu temsil edecek belli bir kesimden veri toplanır ve o veriler kullanılarak toplum hakkında genellemeler yapılabilir.
Python Uygulaması
Yaklaşık 10000 çalışanı olan bir fabrikanın örneklem teorisi ile yaş ortalaması python aracılığla bulunabilir.
#Öncelikle numpy kütüphanemizi import edelim.
#np.random.randint() fonksiyonunu kullanarak yaşları 22 ile 65 yaş arasında değişen 10000 tane random sayısımızı isci_sayısı serisine kaydedelim.
#isci_sayısı yazıp serimizi görüntüleyelim.
#Örneklem çekmeden önce bir seed() ayarı yapmamız gerekli. Bu ne demek makina öğrenmesi veya örneklem gibi konularda önemli bir kavram. Seed kavramı yapılacak olan işlemlerin her tekrar edildiğinde aynı sonuçları getirmesini garanti altına alan bi işlem. Herhangi bir sayı yazabilirsiniz. Seed ayarını garantiledikten sonra örneklem serimizi yazabiliriz.
Pyhton’da örneklem çekmek için bir çok yaklaşım var. Bizim burada kullanacağımız numpy’ın içerisindeki random fonksiyonu. a dediğimiz yer ise ana kitleti ifade ettiğimiz yer. size ile de bu kitle içerisinden rastgele 100 tane örnek çek.
#10000 kişinin arasında çektiğimiz 100 kişinin ortalamasına mean() komutu ile bakalım.
#Şimdi bir de 10000 kişinin ortalamasına bakalım.
Orneklem ile isci_sayısı ‘ nın birbirine ne kadar yakın değerler çıktığını görüyoruz. İşte burada örneklemin ne kadar değerli olduğunu görüyoruz.
#Örneklem dağılımına da kısaca değinecek olursak. Nedir bu örneklem dağılımı. Çektiğimiz 100 kişilik bir örneklem yığınını seçelim. Bunların yaşlarını hesaplıyoruz ve ortalaması 42 civarlarında çıkıyor. Sonra aynı kitleden bir 100 kişilik daha örneklem yığını seçiyoruz ve ortalaması 43 civarı çıkıyor. Gördüğümüz üzere istatiksel değer örneklemden örnekleme göre değişiyor. Bu değerin olasılık dağılımına da örnek dağılımı diyoruz.
Şuan da 10 adet birbirinden farklı örneklemi çekmiş bulunmaktayız. Bu örneklemlerin her birinin ortalamasını alalım ve bu 10 adey örneklemin ortalamasını toplayalım, bunu da 10 a bölelim. Böylece bu 10 adet örneklemin ortalamasını bulmuş olacağız.
42.875 çıktı ortalamamız. Yukarıdaki isci_sayısı ve orneklem ortalamalarına baktığımızda yine yakın bir değer çıktığını görüyoruz.
Böylece Örneklem Teoremi ile ana kitle yaş ortalamasına kolaylıkla ulaşmış oluyoruz.