Sapma ve Standart Sapma
Sapma ve Standart Sapma
Tanımlayıcı ve çıkarımsal istatistiklerde, merkezi eğilimine, dağılımına ve çarpıklığına karşılık gelen bir veri kümesini tanımlamak için çeşitli endeksler kullanılır. İstatistiksel çıkarımda bunlar, popülasyon parametre değerlerini tahmin ettikleri için genellikle tahmin ediciler olarak bilinir.
Dağılım, veri kümesinin merkezi etrafındaki verilerin yayılmasının ölçüsüdür. Standart sapma, en yaygın kullanılan dağılım ölçülerinden biridir. Standart sapma hesaplanırken her bir veri noktasının ortalamadan sapmaları dikkate alınır. Bu nedenle, ortalama ile birlikte standart sapmanın bir veri seti hakkında neredeyse yeterli bir resim sağlayacağı iddia edilebilir.
Aşağıdaki veri kümesini göz önünde bulundurun. 10 kişinin kiloları (kilogram olarak) 70, 62, 65, 72, 80, 70, 63, 72, 77 ve 79 olarak ölçülür. Daha sonra on kişinin ortalama ağırlığı (kilogram olarak) 71'dir (kilogram olarak).).
Sapma nedir?
İstatistikte sapma, tek bir veri noktasının ortalama gibi sabit bir değerden farklılık gösterdiği miktar anlamına gelir. Genel olarak, k sabit bir değer olsun ve x1, x2, …, xn bir veriyi ifade etsin Ayarlamak. Daha sonra, xj 'nin k'den sapması (xj– k) olarak tanımlanır.
Örneğin, yukarıdaki veri setinde ortalamadan ilgili sapmalar (70 – 71)=-1, (62 – 71)=-9, (65 – 71)=-6, (72 – 71)=1, (80 – 71)=9, (70 – 71)=-1, (63 – 71)=-8, (72 – 71)=1, (77 – 71)=6 ve (79 – 71)=8.
Standart sapma nedir?
Tüm popülasyondan elde edilen veriler dikkate alındığında (örneğin bir nüfus sayımı durumunda), popülasyon standart sapmasını hesaplamak mümkündür. Popülasyonun standart sapmasını hesaplamak için önce veri değerlerinin popülasyon ortalamasından sapmaları hesaplanır. Sapmaların ortalama kareköküne (kuadratik ortalama) popülasyon standart sapması denir. Sembollerde, σ=√{ ∑(xi-µ)2 / n} burada µ popülasyon ortalaması ve n popülasyon büyüklüğüdür.
Bir örneklemden (n boyutunda) alınan veriler, popülasyonun parametrelerini tahmin etmek için kullanıldığında, örnek standart sapması hesaplanır. İlk olarak, örnek ortalamadan veri değerlerinin sapmaları hesaplanır. Örnek ortalama, popülasyon ortalaması (bilinmeyen) yerine kullanıldığından, ikinci dereceden ortalamanın alınması uygun değildir. Örnek ortalamasının kullanımını telafi etmek için, sapmaların karelerinin toplamı n yerine (n-1)'e bölünür. Örnek standart sapma bunun karekökü. Matematiksel sembollerde, S=√{ ∑(xi-ẍ)2 / (n-1)}, burada S, örnek standart sapmadır, ẍ örnek ortalamadır ve xi'ler veri noktalarıdır.
Önceki veri setinde, sapma karelerinin toplamı (-1)2 + (-9)2 + (-6)2 + 12 + 92 + (-1) 2 + (-8)2 + 12 + 62 + 82=366. Böylece, popülasyon standart sapması √(366/10)=6.05 (kilogram olarak). (İncelenen nüfusun, verilerin alındığı 10 kişiden oluştuğu varsayılarak).
Sapma ile standart sapma arasındaki fark nedir?
• Standart sapma istatistiksel bir indeks ve tahmin edicidir, ancak sapma değildir.
• Standart sapma, bir veri kümesinin merkezden dağılımının bir ölçüsüdür, sapma ise tek bir veri noktasının sabit bir değerden ne kadar farklılık gösterdiğini ifade eder.