Yapay Zeka Dersleri ve Projeleri

I. Temel İşlemler - I

II. Tokenize (Tokenize etmek)

III. Stemmer (Köklendirme)

IV. Lemmatizer

V. Temel İşlemler - II

VI. Metinleri Vektörleştirme

VII. Model Eğitim İşlemleri

Yazar: Enes ASAN

Yayın tarihi :06-Şub-22

Bölüm kodlarını ve/veya veri setlerini indir.

RegexpStemmer, diğer stemmer modüllerinden farklı olarak kelime içerisinde kaldırmak istenilen ekler kullanıcı tarafından belirtililr.

Kullanılabilmesi için "nltk.stem" paketi altından "RegexpStemmer" modülünün içe aktarılması gerekmektedir.

from nltk.stem import RegexpStemmer

Konu detayları için örnek üzerinden ilerleyelim.

Örnek-1:

#İlgili kütüphaner import edilir
from nltk.stem import RegexpStemmer

#RegexpStemmer tanımlaması yapılır.
#"ing|ed": eğer kelime içerisinde ing ve ed takıları varsa onları kaldır.
R=RegexpStemmer("ing|ed")

print("working:",R.stem("working"))
print("worked:",R.stem("worked"))
print("going:",R.stem("going"))

Çıktı:

working: work
worked: work
going: go

Yukardaki çıktıda görüldüğü gibi ingilizce kelimelere "RegexpStemmer" ile ayırmak istenilen ekler girilerek kök bulma işlemi yapılmış oldu.

SnowballStemmer

Paylaş:

Henüz hiç yorum yapılmamış, ilk yorum yapan sen ol.