Yapay Zeka Dersleri ve Projeleri

İstatistik - Değişkenlik Ölçüleri

Standard Deviation (Standart Sapma)

Yazar: Sefa ASAN

Yayın tarihi :08-Ara-21

Standart Sapma(Standard deviation), en basit anlamıyla veri kümelerinin ortalama olarak değişim miktarının ifadesi ve varyans'ın kareköküdür. Bu ölçü aracı, herhangi bir verinin ortalama değerden uzaklığının ifade edilmesi için kullanılmaktadır. Bu bilgiyi referans alarak, testlemeler sonucunda standart sapmanın büyüklüğü ne kadar fazla olursa, veri setide aynı oranda değişkenlik gösterdiği ifade edilebilir.

Veri bilimininde standart sapma kullanılması istatiksel ölçümlerin kolaylaşmasını sağlamaktadır. Bunun en temel dayanağı ise, standart sapmanın kullanılmasına bağlı olarak değişkenlik yok edilir ve ölçüler birimsizleştirilir. Böylelikle, analizlemeler için oldukça önemli bir işlev gören değişim veya korelasyon katsayılarının hesaplanmaları sağlanır.

Ayrıca, standart sapma çalışmalarımızın başarısı hakkında tahmin yapabilmemize olanak sağlamaktadır. Yani, çalışılmak istenilen verinin aritmetik ortalaması hesaplanır, daha sonra standart sapması hesaplanır ve tahmin yürütmeye başlarız. Eğer, aritmetik ortalama ile standart sapma arasındaki fark büyüme eğilimi gösterirse, verimizin hetorejen bir formda olduğunu söyleyebilir ve bunun sonucunda başarı oranının düşük olabileceğini tahmin edebiliriz. Ancak, bu iki değer birbirine yakınlaşma eğilimi gösterirse, başarı oranımızın arttığını söyleyebiliriz. Kısacası, istatiksel alanda yapılacak testlemelerde standart sapma kullanımı, analiz kabiliyeti üzerinde etkin bir rol oynayabilidiği söylenebilir.

Standart sapma hesaplamaları, varyans hesaplamalarında olduğu gibi evrensel olarak toplamda iki durum üzerinde formülize edilmiştir. Bunlar;

Örnekler için standart sapma
Popülasyonlar için standart sapma

1.Örnekler için standart sapma: Eğer sadece elimizde bir örnek verileri varsa, örnek için standart sapma formulü kullanılması gerekmektedir. Bu formül;

s= Örnek standart sapması
∑ = Toplam
X = Her değer
x̅ = Örnek ortalaması
n = Örnekteki değer sayısı

2. Popülasyonlar için standart sapma: Eğer elimizde sadece bir veri değilde tüm popülasyon verileri varsa, popülasyon için standart sapma formülü kullanılması gerekmektedir. Bu formül;

σ = Popülasyon standart sapması
∑ = Toplam
X = Her değer
μ = Popülasyon ortalaması
N = Popülasyondaki değerlerin sayısı

Veri kümelerinde standart sapmalar hem manuel olarak hem de otomatik olarak(program kullanılarak) hesaplanabilmektedir. Manuel olarak yapılan hesaplamalar karmaşık, zor ve uzun süreceği için, genel olarak standart sapmalar Python programlama dili kütüphanelerinden birisi olan ve matematiksel uzantılardan oluşturulan "NumPy" kütüphanesi kullanılarak oldukça kısa bir zamanda ve kolay bir şekilde hesaplanmaktadır. İlgili kütüphane altında bulunan standart sapma için kullanılan "std()" komutundan faydalanılır.

Örnek-1: Bir X sındavından öğrencilerin almış olduğu puanlar 60, 75, 92, 25, 48, 80, 55 olsun. Bu sınav notlarının standart sapmasını hesaplayalım.

#NumPy kütüphanesi
import numpy as np

#Sınav notları listesi
exam_score=[60, 75, 92, 25, 48, 80, 55]

result=np.std(exam_score)
print(f"Sınav notlarının standart sapması: {result}")

Çıktı:

Sınav notlarının standart sapması: 20.73939365023944

Yukarıdaki çıktıda da görüldüğü üzere sınav notları arasında çok fazla değişkenlik olduğundan dolayı standart sapma değeri 20.74 olarak bulundu.

Örnek-2: Bir Y sındavından öğrencilerin almış olduğu puanlar 90, 88, 92, 95, 89, 91, 100 olsun.(Örnek-1 de verilen sayılara göre birbiri arasında daha az değişkenlik gösterdi.) Bu sınav notlarının standart sapmasını hesaplayalım.

#NumPy kütüphanesi
import numpy as np

#Sınav notları listesi
exam_score=[90, 88, 92, 95, 89, 91, 100 ]

result=np.std(exam_score)
print(f"Sınav notlarının standart sapması: {result}")

Çıktı:

Sınav notlarının standart sapması: 3.833259389999639

Yukarıdaki çıktıda da görüldüğü üzere sınav notları arasında Örnek-1'e göre daha az değişkenlik olduğundan dolayı standart sapma değeri 3.83 olarak bulundu.

Sonuç olarak; görüldüğü üzere veri kümesini oluşturan girdilerin birbirlerine ve ortalama değere yakınlıkları, standart sapma oranında azalma ve başarı oranında da artış olarak ifade edilebilinmektedir.

Interquartile range (Çeyrekler Arası Aralık)

Variance (Varyans)

Paylaş:

Yorumlar

Henüz hiç yorum yapılmamış, ilk yorum yapan sen ol.

İstatistik

I. Değişkenler

II. Fonksiyonlar

III. Değişkenlik Ölçüleri

IV. Değişkenler Arasındaki İlişki

İstatistik - Değişkenlik Ölçüleri

Standard Deviation (Standart Sapma)

Yorumlar