Doğal Dil İşleme (NLP) - Stemmer (Köklendirme)
RegexpStemmer
Yazar:
Enes ASAN
Yayın tarihi :06-Şub-22
Bölüm kodlarını ve/veya veri setlerini indir.
RegexpStemmer, diğer stemmer modüllerinden farklı olarak kelime içerisinde kaldırmak istenilen ekler kullanıcı tarafından belirtililr.
Kullanılabilmesi için "nltk.stem" paketi altından "RegexpStemmer" modülünün içe aktarılması gerekmektedir.
from nltk.stem import RegexpStemmer
Konu detayları için örnek üzerinden ilerleyelim.
Örnek-1:
#İlgili kütüphaner import edilir
from nltk.stem import RegexpStemmer
#RegexpStemmer tanımlaması yapılır.
#"ing|ed": eğer kelime içerisinde ing ve ed takıları varsa onları kaldır.
R=RegexpStemmer("ing|ed")
print("working:",R.stem("working"))
print("worked:",R.stem("worked"))
print("going:",R.stem("going"))
Çıktı:
working: work worked: work going: go
Yukardaki çıktıda görüldüğü gibi ingilizce kelimelere "RegexpStemmer" ile ayırmak istenilen ekler girilerek kök bulma işlemi yapılmış oldu.