Ortalama vs Medyan vs Mod
Ortalama, medyan ve mod, tanımlayıcı istatistiklerde kullanılan başlıca merkezi eğilim ölçüleridir. Birbirlerinden tamamen farklıdırlar ve verileri özetlemek için kullanıldıkları durumlar da farklıdır.
Ortalama
Aritmetik ortalama, veri değerlerinin sayısına bölünen veri değerlerinin toplamıdır, yani
[lateks]\bar{x}=\frac{1}{n}\sum_{i=1}^{n}x_{i}=\frac{x_{1}+x_{2} +x_{3}+…+x_{n}}{n}[/lateks]
Veri bir örnek uzaydan geliyorsa, örneğin tanımlayıcı bir istatistiği olan örnek ortalama ([lateks]\bar{x} [/lateks]) olarak adlandırılır. Bir örneklem için en sık kullanılan tanımlayıcı ölçü olmasına rağmen, sağlam bir istatistik değildir. Aykırı değerlere ve salınımlara karşı çok hassastır.
Örneğin, belirli bir şehrin vatandaşlarının ortalama gelirini düşünün. Tüm veri değerleri toplanıp daha sonra bölündüğü için aşırı zengin bir kişinin geliri ortalamayı önemli ölçüde etkiler. Bu nedenle, ortalama değerler her zaman verilerin iyi bir temsili değildir.
Ayrıca, alternatif bir sinyal durumunda, bir elemandan geçen akım periyodik olarak pozitif yönden negatif yöne ve tersi yönde değişir. Tek bir periyotta elemandan geçen ortalama akımı alırsak, 0 verir, yani elemandan hiç akım geçmemiştir ki bu kesinlikle doğru değildir. Bu nedenle, bu durumda da aritmetik ortalama iyi bir ölçü değildir.
Aritmetik ortalama, veriler eşit olarak dağıtıldığında iyi bir göstergedir. Normal bir dağılım için ortalama, mod ve medyana eşittir. Ayrıca, kök ortalama kare hatası göz önüne alındığında en düşük kalıntılara sahiptir; bu nedenle, bir veri kümesinin tek bir sayı ile temsil edilmesi gerektiğinde en iyi tanımlayıcı ölçüdür.
Ortanca
Tüm veri değerleri artan sırada düzenlendikten sonra ortadaki veri noktasının değerleri, veri kümesinin medyanı olarak tanımlanır. Medyan 2. çeyrek, 5. ondalık ve 50. yüzdelik dilimdir.
• Gözlem sayısı (veri noktaları) tek ise, medyan sıralı listenin tam ortasındaki gözlemdir.
• Gözlem sayısı (veri noktaları) çift ise, medyan sıralı listedeki iki orta gözlemin ortalamasıdır.
Medyan, gözlemi iki gruba ayırır; yani medyandan daha yüksek değerlerden oluşan bir grup (%50) ve daha düşük değerlerden oluşan bir grup (%50). Medyanlar özellikle çarpık dağılımlarda kullanılır ve verileri aritmetik ortalamadan oldukça daha iyi temsil eder.
Mod
Mod, bir dizi gözlemde en çok meydana gelen sayıdır. Bir Veri Kümesinin Modu, küme içindeki her bir öğenin frekansı bulunarak hesaplanır.
• Hiçbir değer birden fazla kez oluşmazsa, veri kümesinde mod yoktur.
• Aksi takdirde, en yüksek frekansta oluşan herhangi bir değer, veri kümesinin bir modudur.
Bir sette 1'den fazla mod bulunabilir; bu nedenle mod, bir veri kümesinin benzersiz bir istatistiği değildir. Düzgün bir dağılımda, bir mod vardır. Kesikli olasılık dağılımı modu, olasılık kütle fonksiyonunun en yüksek noktasına ulaştığı noktadır. Yukarıdaki yorumlardan yola çıkarak, global maksimumların kipler olduğunu söyleyebiliriz.
Aşağıdaki veri kümesine üç ölçünün de uygulanmasını düşünün.
VERİ: {1, 1, 2, 3, 5, 5, 5, 5, 6, 6, 8, 8, 9, 9, 9, 9, 9, 10, 10, 10, 14, 14, 15, 15, 15}
Ortalama=(1+ 1+ 2+ 3+ 5+ 5+ 5+ 5+ 6+ 6+ 8+ 8+ 9+ 9+ 9+ 9+ 10+ 10+ 10+ 14+ 14+ 15+ 15+ 15) / 25=8.12
Medyan=9 (13. element)
Mod=9 (9'luk frekans=5)
Ortalama, Medyan ve Mod arasındaki fark nedir?
• Aritmetik ortalama, değerlerin (gözlemlerin) toplamının gözlem sayısına bölümüdür. Sağlam bir istatistik değildir ve dikkate alınan dağılım içindeki normal dağılım yapısına büyük ölçüde bağlıdır. Tek bir aykırı değer, nispeten yanıltıcı değerler veren ortalamada önemli bir kaymaya neden olabilir. Kavram, geometrik ortalama, harmonik ortalama, ağırlıklı ortalama ve benzerlerine genişletilebilir.
• Medyan, gözlem kümesinin orta değerleridir ve aykırı değerlerden nispeten daha az etkilenir. Çok çarpık durumlarda özet istatistik olarak iyi bir tahmin verebilir.
• Mod, veri kümesindeki en yaygın gözlem değerleridir. Dağılım pozitif çarpık ise mod medyanın solunda, negatif çarpık ise mod sağ medyanın üzerindedir.
• Pozitif çarpıksa, ortalama medyana göre doğrudur; negatif çarpık ise ortalama medyanın solundadır.
• Normal dağılımda, üçü, ortalama, mod ve medyan eşittir.