Merkezi Eğilim ve Dağılım Arasındaki Fark

Merkezi Eğilim ve Dağılım Arasındaki Fark
Merkezi Eğilim ve Dağılım Arasındaki Fark

Video: Merkezi Eğilim ve Dağılım Arasındaki Fark

Video: Merkezi Eğilim ve Dağılım Arasındaki Fark
Video: Işık Nedir? #4 2024, Aralık
Anonim

Merkezi Eğilim vs Dağılım

Tanımlayıcı ve çıkarımsal istatistiklerde, merkezi eğilimine, dağılımına ve çarpıklığına karşılık gelen bir veri kümesini tanımlamak için çeşitli endeksler kullanılır: bir veri kümesinin dağılımının göreli şeklini belirleyen en önemli üç özellik.

Merkezi eğilim nedir?

Merkezi eğilim, değerlerin dağılımının merkezini ifade eder ve konumlandırır. Ortalama, mod ve medyan, bir veri setinin merkezi eğilimini tanımlamada en sık kullanılan indekslerdir. Bir veri kümesi simetrik ise, veri kümesinin hem medyanı hem de ortalaması birbiriyle çakışır.

Verilen bir veri seti, ortalama, tüm veri değerlerinin toplamı alınarak ve ardından veri sayısına bölünerek hesaplanır. Örneğin 10 kişinin ağırlıkları (kilogram olarak) 70, 62, 65, 72, 80, 70, 63, 72, 77 ve 79 olarak ölçülür. O halde on kişinin ortalama ağırlığı (kilogram olarak) şu şekilde olabilir: aşağıdaki gibi hesaplanır. Ağırlıkların toplamı 70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79=710'dur. Ortalama=(toplam) / (veri sayısı)=710 / 10=71 (kilogram olarak). Aykırı değerlerin (normal eğilimden sapan veri noktaları) ortalamayı etkileme eğiliminde olduğu anlaşılmaktadır. Bu nedenle, uç değerlerin varlığında tek başına ortalama veri kümesinin merkezi hakkında doğru bir resim vermeyecektir.

Ortanca, veri kümesinin tam ortasında bulunan veri noktasıdır. Medyanı hesaplamanın bir yolu, veri noktalarını artan düzende sıralamak ve ardından veri noktasını ortada konumlandırmaktır. Örneğin, bir kez sipariş edildiğinde önceki veri seti 62, 63, 65, 70, 70, 72, 72, 77, 79, 80 gibi görünür. Dolayısıyla (70+72)/2=71 ortadadır. Buradan, medyanın veri setinde olmasına gerek olmadığı görülmektedir. Medyan, aykırı değerlerin varlığından etkilenmez. Bu nedenle medyan, aykırı değerlerin varlığında daha iyi bir merkezi eğilim ölçüsü işlevi görecektir.

Mod, veri kümesinde en sık meydana gelen değerdir. Önceki örnekte, 70 ve 72 değerlerinin her ikisi de iki kez oluşur ve bu nedenle her ikisi de moddur. Bu, bazı dağılımlarda birden fazla mod değeri olduğunu gösterir. Yalnızca bir mod varsa, veri kümesinin tek modlu olduğu söylenir, bu durumda veri kümesi iki modludur.

Dağılım nedir?

Dağılım, dağıtımın merkezi hakkındaki verilerin yayılma miktarıdır. Aralık ve standart sapma, en yaygın kullanılan dağılım ölçüleridir.

Aralık, en yüksek değer eksi en düşük değerdir. Bir önceki örnekte, en yüksek değer 80 ve en düşük değer 62'dir, bu nedenle aralık 80-62=18'dir. Ancak aralık, dağılım hakkında yeterli bir resim sağlamamaktadır.

Standart sapmayı hesaplamak için önce veri değerlerinin ortalamadan sapmaları hesaplanır. Sapmaların ortalama kareköküne standart sapma denir. Önceki örnekte, ortalamadan ilgili sapmalar (70 – 71)=-1, (62 – 71)=-9, (65 – 71)=-6, (72 – 71)=1, (80 – 71)=9, (70 – 71)=-1, (63 – 71)=-8, (72 – 71)=1, (77 – 71)=6 ve (79 – 71)=8. Toplamı sapma kareleri (-1)2 + (-9)2 + (-6)2+ 12 + 92 + (-1)2 + (-8) 2 + 12 + 62 + 82=366 Standart sapma √(366/10)=6.05'tir (kilogram olarak). Veri kümesi büyük ölçüde çarpık olmadıkça, bundan, verilerin çoğunluğunun 71±6.05 aralığında olduğu sonucuna varılabilir ve bu özel örnekte gerçekten de öyledir.

Merkezi eğilim ve dağılım arasındaki fark nedir?

• Merkezi eğilim, değerlerin dağılımının merkezini ifade eder ve konumlandırır

• Dağılım, bir veri kümesinin merkezi hakkındaki verilerin yayılma miktarıdır.

Önerilen: