Doğal Dil İşleme (NLP) - Stemmer (Köklendirme)

RegexpStemmer

Yayın tarihi :06-Şub-22
Bölüm kodlarını ve/veya veri setlerini indir.

RegexpStemmer, diğer stemmer modüllerinden farklı olarak kelime içerisinde kaldırmak istenilen ekler kullanıcı tarafından belirtililr.

Kullanılabilmesi için "nltk.stem" paketi altından  "RegexpStemmer" modülünün içe aktarılması gerekmektedir.

from nltk.stem import RegexpStemmer

Konu detayları için örnek üzerinden ilerleyelim.

Örnek-1:

#İlgili kütüphaner import edilir
from nltk.stem import RegexpStemmer
#RegexpStemmer tanımlaması yapılır.
#"ing|ed": eğer kelime içerisinde ing ve ed takıları varsa onları kaldır.
R=RegexpStemmer("ing|ed")
print("working:",R.stem("working"))
print("worked:",R.stem("worked"))
print("going:",R.stem("going"))

Çıktı:

working: work
worked: work
going: go

Yukardaki çıktıda görüldüğü gibi ingilizce kelimelere "RegexpStemmer" ile ayırmak istenilen ekler girilerek kök bulma işlemi yapılmış oldu.

Paylaş:

Yorum Yap (*Yorumunuza kod eklemek isterseniz Kod Parçacığı Ekle butonuna tıklayarak ekleyebilirsiniz.)

Yorumlar

Henüz hiç yorum yapılmamış, ilk yorum yapan sen ol.