Varyans ve Kovaryans
Varyans ve kovaryans, istatistikte kullanılan iki ölçüdür. Varyans, verilerin dağılımının bir ölçüsüdür ve kovaryans, iki rastgele değişkenin birlikte değişim derecesini gösterir. Varyans daha çok sezgisel bir kavramdır, ancak kovaryans matematiksel olarak ilk başta o kadar da sezgisel olarak tanımlanmaz.
Varyans hakkında daha fazla bilgi
Varyans, verilerin dağılımın ortalama değerinden dağılımının bir ölçüsüdür. Veri noktalarının dağılımın ortalamasından ne kadar uzakta olduğunu söyler. Olasılık dağılımının birincil tanımlayıcılarından ve dağılımın anlarından biridir. Ayrıca varyans, popülasyonun bir parametresidir ve popülasyondan bir örneğin varyansı, popülasyonun varyansı için bir tahmin edici olarak işlev görür. Bir açıdan, standart sapmanın karesi olarak tanımlanır.
Sade bir dille, her veri noktası arasındaki mesafenin karelerinin ortalaması ile dağılımın ortalaması olarak tanımlanabilir. Varyansı hesaplamak için aşağıdaki formül kullanılır.
Bir popülasyon için
Var(X)=E[(X-µ)2] ve
Var(X)=E[(X-‾x)2] bir örnek için
Var(X)=E[X2]-(E[X])2 vermek için daha da basitleştirilebilir.
Varyance'ın bazı imza özellikleri vardır ve genellikle kullanımı kolaylaştırmak için istatistiklerde kullanılır. Varyans, mesafelerin karesi olduğu için negatif değildir. Ancak, varyansın aralığı sınırlı değildir ve belirli dağılıma bağlıdır. Sabit bir rastgele değişkenin varyansı sıfırdır ve varyans bir konum parametresine göre değişmez.
Kovaryans hakkında daha fazla bilgi
İstatistiksel teoride kovaryans, iki rastgele değişkenin birlikte ne kadar değiştiğinin bir ölçüsüdür. Başka bir deyişle, kovaryans, iki rastgele değişken arasındaki korelasyonun gücünün bir ölçüsüdür. Ayrıca iki rastgele değişkenin varyans kavramının bir genellemesi olarak da düşünülebilir.
Sonlu ikinci momentumla birlikte dağıtılan iki rastgele değişken X ve Y'nin kovaryansı σXY=E[(X-E[X])(Y-E[olarak bilinir. Y])]. Bundan, varyans, iki değişkenin aynı olduğu özel bir kovaryans durumu olarak görülebilir. Cov(X, X)=Var(X)
Kovaryansı normalleştirerek, doğrusal korelasyon katsayısı veya ρ=E[(X-E[X])(Y-E[Y])]/(σ olarak tanımlanan Pearson korelasyon katsayısı elde edilebilir. X σY)=(Cov(X, Y))/(σX σY )
Grafik olarak, bir çift veri noktası arasındaki kovaryans, veri noktaları zıt köşelerde olan dikdörtgenin alanı olarak görülebilir. İki veri noktası arasındaki ayrımın büyüklüğünün bir ölçüsü olarak yorumlanabilir. Tüm popülasyon için dikdörtgenler göz önüne alındığında, tüm veri noktalarına karşılık gelen dikdörtgenlerin örtüşmesi, ayrımın gücü olarak kabul edilebilir; iki değişkenin varyansı. Kovaryans, iki değişken nedeniyle iki boyuttadır, ancak bunu bir değişkene basitleştirmek, bir boyuttaki ayrım olarak tek bir varyansı verir.
Varyans ve Kovaryans arasındaki fark nedir?
• Varyans, bir popülasyondaki yayılma/dağılımın ölçüsüdür, kovaryans ise iki rastgele değişkenin varyasyonunun bir ölçüsü veya korelasyonun gücü olarak kabul edilir.
• Varyans, kovaryansın özel bir durumu olarak düşünülebilir.
• Varyans ve kovaryans, veri değerlerinin büyüklüğüne bağlıdır ve karşılaştırılamaz; bu nedenle normalleştirilirler. Kovaryans, korelasyon katsayısına (iki rastgele değişkenin standart sapmalarının çarpımına bölünerek) normalleştirilir ve varyans, standart sapmaya (kare kökü alınarak) normalleştirilir