Makine Öğrenmesi

Regresyon (Regression)

Yayın tarihi :04-Oca-22

Makine Öğreniminde Regresyon Analizi Nedir?

Regresyon analizi, iki veya daha fazla bağımlı ve bağımsız değişkenlerin birbirleri ile olan ilişkisini mimimum bir ve/veya daha fazla bağımsız değişkenle modelleme, oluşturulan modelleri analiz etme ve analiz sonuçlarına göre sayısal bir tahminde bulunmayı sağlayan istatistiksel bir işlemidir. Daha basit ifadesiyle regresyon analizi; çalışmalarda kullanılmak istenilen bağımsız değişkenlerin sabit tutularak, bağımsız değişkene karşılık gelen bağımlı değişkenin nasıl bir değersel değişim yaşadığının anlaşılmasını sağlamaktadır.

Regresyon analizi makine öğrenimi kapsamında denetimli öğrenme tekniği olarak tanımlanabilir. Bu durumdan dolayı, çalışmalarda kullanılacak değişkenlerin aralarında oluşabilecek korelasyon değerlerinin tespit edilmesi ve tahminsel değişkenlere bağlı olarak anlık çıktı değişkenlerinin ne olabileceğinin tahminlenmesi sağlanır. 

Regresyon analizinde, kullanılacak veri kümeleri içerisinde bulunan veri noktalarına en uygun eşleşme(karşılık gelebilecek değerler) sağlayan değerlerin grafikleri çizilir ve çizilen bu grafikler, oluşturulan makine öğrenimi modeli tarafından analizlenir. Bu analizleme sonuçlarına göre veriler hakkında tahminlemeler yapılabilinmektedir. Bu durumu daha basit bir şekilde ifade etmek gerekirse; regresyon, bağımlı değişken tahmin grafiğinde yer alan bütün veri noktalarından geçen, verisel noktalar ile regresyon çizgisinin arasında kalan eğrinin veya doğrusal çizginin, dikeysel minimum oranlardaki ifadesinin belirtilmesi için kullanılmaktadır. Bu kullanıma bağlı olarak veri noktaları ile çizgi veya eğrinin birbirleriyle ilişkileri analiz edilir ve bu analizmele sonuçlarına göre modelin ilişki gücü tespit edilebilir. Yani, eğer veri noktaları ile doğrusal veya eğrisel çizgiler arasında dikey olarak kısa bir mesafe gözlenirse bu durumda modelin ilişki gücünün yüksek olduğu söylenebilir. 

Analiz ve tahminleme sonuçlarının doğru bir değerde oluşabilmesi için işleme giren değişken değerlerinin temiz ve anlaşılabilir olması gerekmektedir. Analiz sonucunda değişkenlerin birbirini etkileyip etkilemediği konusunda bir sonuca varırız. Diğer bir deyişle hangi değişken değerinin önemli olduğu veya hangi değişken değerinin göz ardı edilebileği sonucuna varırız.

Günümüzde regresyon analizi birçok farklı alanda oldukça başarılı bir şekilde kullanılmaktadır. Örneğin;

  • Bir şehirdeki ev fiyatlarını tahmin etmek için bir model oluşturmak isteyelim. Evin hangi semtte olduğu, kaç odalı, kaçıncı kat, kaç yıllık bir ev olduğu vb. değerlerle bu evlerin fiyat bilgilerini tutan bir tablo makineye verildiğinde makine bu değerler arasında bir ilişki kurarak, tabloda dahi yer almayan bir ev özellikleri girildiğinde o evin fiyatının ne olacağını tahmin edebilir. Tahmin değerleri %99 oranında bile doğru değerlerde çıkmaktadır. Tabi girdi olarak ne kadar çok detay verirseniz doğruluk payı da ona göre artacaktır.
  • Herhangi şirketin satış değerleri verdiği reklamlarla ne kadar bağlantılı olduğu tahmin edilebilir. Gazeteye, TV'ye veya Radyoya reklam verdiğinde elde ettiği satış değerleri tablo halinde makineye verilidiğinde hangi yöntemin daha çok kar getireceği önceden tahmin edebilir.

Verilen örneklerin haricinde borsa tahminlerinde, sanal para fiyatlandırmasında (bitcoin vs.) dahi kullanılabilecek bir yöntemdir. Bu örnekler gibi milyonlarca örnek verilebilir.

Sonuç olarak makineye girdi verip çıktı değerlerini milisaniyeler içinde tahmin etme işleminde kullanılan bir makine öğrenmesi tekniğidir.

 

Regresyon Analizinde Kullanılan Terminolojiler Nelerdir?

Hemen hemen her alanda olduğu gibi, regresyon analizinde de birtakım anahtar ifadeler kullanılmaktadır. Yaygın olarak kullanılan bu ifadeler;

  • Bağımlı Değişkenler: Bu değişken türleri analizde "hedef" değişken olarak bilinmektedir. Bu değişkenler çalışmalarda tahminsel analizlemeler yapmak için kullanılan ana faktörlerdir. 
  • Bağımsız Değişkenler: Bu değişkenler "Kestirici" veya "Öngörücü" olarak bilinmektedir. Bu değişkenler, ana faktör olan bağımlı değişkenlerin değerlerinin tahmin edilmesi için kullanılır.
  • Aykırı Değerler: Yapılan çalışmalarda analizlenen değerler arasında, diğer değerlere göre oldukça düşük veya yüksek ifade gösterebilen değerler aykırı değerler olarak tanımlanabilir. Yapılan gözlemlerde bu değerlerin varlığı, çalışmaların olumsuz bir şekilde sonuçlanmasına neden olabilmektedir. Olumsuzluktan kurtulmak için aykırı bir değer farkedildiği zaman ortamdan uzaklaştırılması gerekmektedir. 
  • Çoklu Bağlantı: Bağımlı değişkenlerin tahminlenmesi için kullanılan bağımsız değişkenler arasında diğer değişkenlere oranla yüksek bir ilişki olması durumudur. Bu durum çalışmaları oldukça olumsuz etkileyebilir. Çünkü, tahminsel analizlemeler yaparken ilişki düzeylerinin sıralamaları karmaşık bir forma dönüşür ve bundan dolayı uygun sıralama yapılamaz.
  • Aşırı Uyum: Çalışmalarda kullanılacak algoritmalar, eğitim amaçlı oluşturulan veri kümeleriyle oldukça yüksek performanslı bir uyum içinde ancak test amaçlı oluşturulan veri kümeleriyle uyumlu değilse bu durum aşırı uyumluluk olarak ifade edilir.
  • Yetersiz Uyum: Kullanılan algoritmaların hem eğitim veri kümeleriyle hem de test veri kümeleriyle oldukça düşük performans gösterdiği durumlar olarak tanımlanabilir.

 

Regresyon Analizi Neden Kullanılır?

Dünyamızın hızla değişimi ve gelişimine bağlı olarak birçok farklı alanda iş yüklerinde aşırı artışlar yaşanmaktadır. Bu artışlar neticesinde artık sadece insan müdehalesi yeterli olmamakta, insan müdehalesi yeterli olsa bile çalışmalarda hata payları yüksek olabilmektedir. Meydana gelebilecek bu durumlara karşı oldukça kısa zamanlarda etkili bir sonuçlar alabilmek için regresyon analizlemeleri kullanılmaktadır. Bu kullanıma bağlı olarak gelecek hava durumlarının tahmini, borsa değerlerinin nasıl eğilim göstereceği veya gelecek dünyamızın nasıl şekillenebileceği vb. oldukça basit bir şekilde yapılabilinmektedir. Böylelikle hangi alanda olursa olsun gerçek değerlerden hareketle gerçeğe en yakın değerler kısa zamanlarda ve yüksek performansla tespit edilmektedir.

 

Regresyon Çeşitleri Nelerdir?

Makine öğrenimi alanında oldukça etkili ve güvenilir sonuçlar meydana getirebilmek için birçok farklı regresyon türü kullanılmaktadır. Bu türler yapılacak çalışmalara ve kaynak materyale göre farklılaşmalar gösterebilmektedir. Ancak tüm regresyon çeşitleri temel olarak tek bir durum üzerinde birleşir ve bu durum "Bağımsız değişkenlerin, bağımlı değişkenler üzerindeki etkilerinin analizlenmesi" olarak ifade edilebilir. Günümüzde yaygın olarak kullanılan regresyon türleri;

1. Doğrusal Regresyon (Linear Regression)

  • Basit Doğrusal Regresyon (Simple Linear Regression)
  • Çok Değişlenli Doğrusl Regresyon(Multi-variable Linear Regression)

  • Düzenlileştirme(Regularization)
    • Ridge Regression
    • Lasso Regression
    • Elastic-Net Regression

2. Doğrusal Olmayan Regresyon (Non-Linear Relationships)

  • Polinom Regresyon (Polynomial Regression)
    • Güç fonksiyonları (Power Functions)
    • Logaritmik/Üstel Fonksiyonlar (Logarithmic/Exponential Functions)
    • Prebabilistik Fonksiyonlar (Probabilistic Functions)
Paylaş:

Yorum Yap (*Yorumunuza kod eklemek isterseniz Kod Parçacığı Ekle butonuna tıklayarak ekleyebilirsiniz.)

Yorumlar

Henüz hiç yorum yapılmamış, ilk yorum yapan sen ol.