İstatistik - Değişkenler Arasındaki İlişki

Spearman Sıra Korelasyonu

Yayın tarihi :08-Ara-21

 Spearman Sıra Korelasyonu(Spearman rho), veri seti içerisinde bulunan değişkenlerin dağılımlarının normal olmadığı durumlarda herhangi iki farklı değişkenin aralarındaki ilişkiyi ölçmek için kullanılan parametresiz bir korelasyon testidir. Bu testin ismi, istatistik alanında öncü sayılan Amerikalı istatik bilimcisi Charles Spearman'dan gelmektedir. 

Bu korelasyon testi, veri dağılımları hakkında herhangi bir kuramsal düşünce özelliği taşımaz ve değişkenlerin sıralı bir ölçek dahilinde bulunduğu durumlar için uygun analizlemeler yapabilmektedir.

Bu bilgilerden hareketle spearman sıra korelasyonu, iki farklı değişkenin sürekli ve sıralı durumlardaki formları arasındaki tek düze bir ilişkiyi analizler. Yani, değişkenler arasındaki tek düze ilişki olması, değişkenlerin birlikte değişim gösterme eylemi olarak tanımlanabilir. Böyle durumlarda temek kritik nokta, değişim oranlarının kesin olarak sabit bir oranda olmamasıdır. 

Günümüzde spearman koleksiyonu genel olarak, sıralı bir formda bulunan değişkenler arasındaki ilişkinin ölçülmesi için kullanılmaktadır. Örneğin bir öğrencinin A ve B sınavından almış olduğu notların birbirleri ile karşılaştırılması işleminde kullanılabilir.

Formül;

Spearman sıra koleksiyonu Yunan alfabesi harflerinden birisi olan "ρ" ile tanımlanır:

  • ρ = Spearman sıra korelasyonu
  • di = Değişkenlerin sıraları arasındaki fark
  • = Gözlem sayısı

Bu formül kullanılarak manuel bir şekilde iki veri arasındaki ilişkinin hesaplamaları yapılmaktadır. Ancak görüldüğü üzere pearson formülü oldukça karmaşık bir formda bulunmaktadır. Bu nedenle manuel olarak yapılacak hesaplamaların hata payı yüksek olabilir ve zaman açısından kayıplar yaşanabilir. Meydana gelebilecek olumsuz durumlardan kurtulmak için, Python programlama dili pearson korelasyonu için kullanılabilir. 

Veri kümelerinde sperman korelasyonu hesaplamaları hem manuel olarak hem de program kullanılarak hesaplanabilmektedir. Manuel olarak yapılan hesaplamalar karmaşık, zor ve uzun süreceği için, genel olarak sperman korelasyonu hesaplamaları Python programlama dili kütüphanelerinden birisi olan ve bilimsel hesaplamalar için temel algoritmaları içeren "SciPy" kütüphanesi kullanılarak oldukça kısa bir zamanda ve kolay bir şekilde hesaplanmaktadır. İlgili kütüphane altında bulunan sperman korelasyonu için kullanılan "spearmanr()" komutundan faydalanılır.

Söz dizimi: stats.spearmanr(a, b=None, axis=0, nan_policy='propagate', alternative='two-sided')

  • a, ilk değişkenin girdi dizisini temsil eder.
  • b, ikinci değişkenin girdi dizisini temsil eder.
  • axis, veris seti kullanıldığı durumlarda yatay/dikey değerleri seçmek için kullanılır.
  • nan_policy, girdilerde bulunan "NaN" değerlerinin nasıl işleneceğini temsil eder. 3 farklı değer alabilir; "propagate", "raise", "omit". Varsayılan olarak "propagate" dir.
    • propagate, "Nan" değerini döndürür.
    • raise, hata verir.
    • omit, "NaN" değerini atlar(çıkarır).
  • alternative, alternatif hipotezi tanımlar. 3 farklı değer alabilir; "two-sided", "less", "greater". Varsayılan olarak "two-sided" dir. 
    • two-sided, korelasyon 0 değildir.
    • less, korelasyon negatiftir.
    • greater, korelasyon pozitiftir.

"spearmanr()" sonrasında (correlation , p-value) değerleri geri döner.

  • correlation , korelasyon katsayısını temsil eder.
  • p-value, olasılık anlamlılık değeridir, sıfır hipotezin kabul edilip edilmeyeceğini temsil eder.

Python'da Spearman Korelasyon Hesaplama

Örnek-1: 10 tane öğrencilerin A ve B sınavından almış olduğu puanları rasgele oluşturalım ve birbirleri ile spearman koleksiyonu katsayısını gözlemleyelim.

#Rastgele sınav notları oluşturuldu ve yazdırıldı
A_exam=np.random.randint(80,100,10)
B_exam=np.random.randint(30,80,10)
print(f"A sınavı not sonuçları: {A_exam}")
print(f"B sınavı not sonuçları: {B_exam}")
print("******")

#spearmanr hesaplaması yapıldı
cor,p_value=stats.spearmanr(A_exam,B_exam)
print(f"Korelasyon katsayısı: {cor}")
print(f"pvalue değeri: {p_value}")

Çıktı:

A sınavı not sonuçları: [85 99 93 94 97 98 89 85 97 90]
B sınavı not sonuçları: [75 71 32 36 47 54 46 45 67 66]
******
Korelasyon katsayısı: 0.18902790432892227
pvalue değeri: 0.60096233836
Paylaş:

Yorum Yap (*Yorumunuza kod eklemek isterseniz Kod Parçacığı Ekle butonuna tıklayarak ekleyebilirsiniz.)

Yorumlar

Henüz hiç yorum yapılmamış, ilk yorum yapan sen ol.