Makine Öğrenmesi - Genel Konular

Doğrusal ve Doğrusal Olmayan Regresyonları Birlikte Kullanma - II (PyCaret)

Yayın tarihi :12-Oca-22
Bölüm kodlarını ve/veya veri setlerini indir.

PyCaret, doğrusal ve doğrusal olmayan regresyonların tamamını birlikte kullanabilmeye olanak sağlayan bir kütüphanedir. Modellerin performansını analiz etmek için 25'ten fazla algoritmaya ve model sonuçlarını görselleştirmek için grafiklendirme yapabilecek yapılara sahiptir. 

Kullanabilmek için ilgili PyCaret'in indirilmesi ve içe aktarılması gerekmektedir.

pip install pycaret
from pycaret.regression import*

Söz dizimi: setup(data, target, train_size = 0.7, sampling = True, sample_estimator = None, categorical_features = None, categorical_imputation = ‘constant’, ordinal_features = None, high_cardinality_features = None, high_cardinality_method = ‘frequency’, numeric_features = None, numeric_imputation = ‘mean’, date_features = None, ignore_features = None, normalize = False, normalize_method = ‘zscore’, transformation = False, transformation_method = ‘yeo-johnson’, handle_unknown_categorical = True, unknown_categorical_method = ‘least_frequent’, pca = False, pca_method = ‘linear’, pca_components = None, ignore_low_variance = False, combine_rare_levels = False, rare_level_threshold = 0.10, bin_numeric_features = None, remove_outliers = False, outliers_threshold = 0.05, remove_multicollinearity = False, multicollinearity_threshold = 0.9, create_clusters = False, cluster_iter = 20, polynomial_features = False, polynomial_degree = 2, trigonometry_features = False, polynomial_threshold = 0.1, group_features = None, group_names = None, feature_selection = False, feature_selection_threshold = 0.8, feature_interaction = False, feature_ratio = False, interaction_threshold = 0.01, transform_target = False, transform_target_method = ‘box-cox’, session_id = None, silent=False, profile = False)

  • data, veri setini temsil etmektedir.(Örneğin df)
  • target, tahmin edilecek değişkeni temsil etmektedir.
  • train_size, test ve train verilerini parçalama oranıdır. Varsayılan train veri seti oranı 0.7 olarak ayrılmıştır. 

Örnek-1:

import pandas as pd
import numpy as np

from pycaret.regression import*
dfCars=pd.read_excel("cars.xls")
dfCars.head()

Çıktı:

exp_name=setup(data=dfCars,target="Price")

Yukarıdaki kodu çalıştırdığınızda sizden target değerini isteyen bir input giriş ekranı gelecektir. O alana hedef değişkeni olan "Price" yazılabilir veya setup(... target="Price") olarak belirttiğimiz için hiç birşey yazmdan da enter tuşuna basak atlayabilirsiniz. Daha sonra tüm veri setinin özelliklerinin yer aldığı bir tablo oluşacaktır. İlk 5 satırının çıktısı aşağıdaki gibi olacaktır.

Çıktı:

PyCaret içerisinde bulunan modellerin karşılaştırmalı olarak değerlerini listelemek için compare_models() kod parçacığı kullanılabilir.

compare_models()

Çıktı:

Yukarıdaki tabloda birçok regresyon modelinin yer aldığı modeller ve mae, mse, rmse ve r2_scrore değerleri listelendi,ve en iyi değerlerin de renkleri boyanarak belirtilmiştir. Tabloda r2_score değeri olarak en iyi regresyon modeli olarak "Lasso" görünmektedir.

İlgili modeli kullanabilmek için create_model() kod parçacığı kullanılabilir.

model=create_model("lasso")

Çıktı:

#Lasso modeli model adında kaydedildi ve görüntüleyelim.
print(model)

Çıktı:

Lasso(alpha=1.0, copy_X=True, fit_intercept=True, max_iter=1000,
      normalize=False, positive=False, precompute=False, random_state=5300,
      selection='cyclic', tol=0.0001, warm_start=False)

Modelin performansını görüntülemek için de plot_model() kod parçası kullanılarak grafik çıktısı alınabilir.

plot_model(model)

Çıktı:

Paylaş:

Yorum Yap (*Yorumunuza kod eklemek isterseniz Kod Parçacığı Ekle butonuna tıklayarak ekleyebilirsiniz.)

Yorumlar

Henüz hiç yorum yapılmamış, ilk yorum yapan sen ol.