Makine Öğrenmesi - Regresyon İçin Model Değerlendirmesi

MSE, RMSE, MAE, R2_Score

Yayın tarihi :16-Oca-22
Bölüm kodlarını ve/veya veri setlerini indir.

MSE, RMSE, MAE, R2_Score, regresyon analizinde modelin performansını değerlendirmek için kullanılır. İlgili değerleri daha iyi anlayabilmek için örnek üzerinden anlatalım.

#Kullanılacak kütüphaneler import edildi
import pandas as pd
import numpy as np
#x değeri orijinal değerler
#y değerleri de makine öğrenmesi sonucunda tahmin edilen değerler olsun.
x=[4,5,6,8,0,4,2]
y=[4.7,5.3,5.6,9,0.8,3.5,3.4]

Aşağıdaki konu anlatımlarında x ve y değerlerinin birbirine olan ilişkisi incelenecektir.

1. Mean Square Error - MSE (Ortalama Kare Hatası)

MSE, veri kümesindeki orijinal ve tahmin edilen değerler arasındaki kare farkının ortalamasını temsil eder. Daima pozitif değerdedir. MSE değerinin sıfıra yakın olması ilgili tahminleyici modülün daha iyi performans gösterdiği söylenebilir. 

Kullanabilmek için ilgili modülün içe aktarılması gerekmektedir.

from sklearn.metrics import mean_squared_error
mean_squared_error(x,y)

Çıktı:

0.6557142857142858

x ve y değerlerinin ortalama kare hata değeri (MSE) 0.655 olarak bulunmuş oldu.

2. Root Mean Square Error - RMSE (Kök Ortalama Kare Hata)

RMSE, veri kümesindeki orijinal ve tahmin edilen değerler arasındaki uzaklığın bulunmasında kullanılır. Regresyon çizgisinin tahmin edilen veri noktalarından ne kadar uzakta olduğunun ölçüsüne artıklar denir. RMSE, bu artıkların ne kadar yayıldığının bir ölçüsüdür. Yani verilerin en uygun çizgi etrafında ne kadar yoğun olduğunu söyler. RMSE değeri ne kadar küçükse tahminleyici modülün daha iyi performans gösterdiği söylenebilir. MSE (Ortalama Kare Hatası)'nin kareköküdür.

Kullanabilmek için ilgili modülün içe aktarılması gerekmektedir.

from sklearn.metrics import mean_squared_error
np.sqrt(mean_squared_error(x,y))
#veya
#(mean_squared_error(x,y))**.5

Çıktı:

0.8097618697581936

3. Mean Absolute Error - MAE (Ortalama Mutlak Hata)

MAE, veri kümesindeki orijinal ve tahmin edilen değerlerin arasındaki mutlak farkın tüm dizi üzerinden toplanması ve ardından elde edilen toplamın dizideki gözlem sayısına bölünmesiyle hesaplanır.

Kullanabilmek için ilgili modülün içe aktarılması gerekmektedir.

from sklearn.metrics import mean_absolute_error
mean_absolute_error(x,y)

Çıktı:

0.7285714285714285

4. R2_Score

R2_Score, veri kümesindeki orijinal değerler sonucunda tahmin edilen değerlerin ne oranda başarılı bir sonuç verdiğini göstermek için kullanılır. r2_score değeri maksimum 1.0'dir. R2_score değeri 1.0 değerine ne kadar yakınsa o kadar başarılı bir sonuç verdiği anlamına gelmektedir. Yüzde olarak kullanabilmek için 100 ile r2_score değeri çarpılır.

Kullanabilmek için ilgili modülün içe aktarılması gerekmektedir.

from sklearn.metrics import r2_score
r2_score(x,y)*100

Çıktı:

88.76573426573427

Yukarda bulunan değerin açıklaması: x listesi y listesine %88,76 oranında benzerdir.

Paylaş:

Yorum Yap (*Yorumunuza kod eklemek isterseniz Kod Parçacığı Ekle butonuna tıklayarak ekleyebilirsiniz.)

Yorumlar

Henüz hiç yorum yapılmamış, ilk yorum yapan sen ol.