Doğal Dil İşleme (NLP) - Temel İşlemler - II

Googletrans ile Dil Algılama ve Çeviri İşlemleri

Yayın tarihi :06-Şub-22
Bölüm kodlarını ve/veya veri setlerini indir.

Googletrans, Google çeviri ile yapılacak olan işlemlerin Python üzerinden yapılmasını sağlayan bir kütüphanedir. 

Kullanabilmek için "googletrans" kütüphanesinin indirilmesi ve içe aktarılması gerekmektedir. **Kurulum sonrasında Kernel'in Restart edilmesi gerekebilecektir.

pip install googletrans
import googletrans

Desteklenen diller listesi;

print(googletrans.LANGUAGES)

Çıktı:

{'af': 'afrikaans', 'sq': 'albanian', 'am': 'amharic', 'ar': 'arabic', 'hy': 'armenian', 'az': 'azerbaijani', 'eu': 'basque', 'be': 'belarusian', 'bn': 'bengali', 'bs': 'bosnian', 'bg': 'bulgarian', 'ca': 'catalan', 'ceb': 'cebuano', 'ny': 'chichewa', 'zh-cn': 'chinese (simplified)', 'zh-tw': 'chinese (traditional)', 'co': 'corsican', 'hr': 'croatian', 'cs': 'czech', 'da': 'danish', 'nl': 'dutch', 'en': 'english', 'eo': 'esperanto', 'et': 'estonian', 'tl': 'filipino', 'fi': 'finnish', 'fr': 'french', 'fy': 'frisian', 'gl': 'galician', 'ka': 'georgian', 'de': 'german', 'el': 'greek', 'gu': 'gujarati', 'ht': 'haitian creole', 'ha': 'hausa', 'haw': 'hawaiian', 'iw': 'hebrew', 'he': 'hebrew', 'hi': 'hindi', 'hmn': 'hmong', 'hu': 'hungarian', 'is': 'icelandic', 'ig': 'igbo', 'id': 'indonesian', 'ga': 'irish', 'it': 'italian', 'ja': 'japanese', 'jw': 'javanese', 'kn': 'kannada', 'kk': 'kazakh', 'km': 'khmer', 'ko': 'korean', 'ku': 'kurdish (kurmanji)', 'ky': 'kyrgyz', 'lo': 'lao', 'la': 'latin', 'lv': 'latvian', 'lt': 'lithuanian', 'lb': 'luxembourgish', 'mk': 'macedonian', 'mg': 'malagasy', 'ms': 'malay', 'ml': 'malayalam', 'mt': 'maltese', 'mi': 'maori', 'mr': 'marathi', 'mn': 'mongolian', 'my': 'myanmar (burmese)', 'ne': 'nepali', 'no': 'norwegian', 'or': 'odia', 'ps': 'pashto', 'fa': 'persian', 'pl': 'polish', 'pt': 'portuguese', 'pa': 'punjabi', 'ro': 'romanian', 'ru': 'russian', 'sm': 'samoan', 'gd': 'scots gaelic', 'sr': 'serbian', 'st': 'sesotho', 'sn': 'shona', 'sd': 'sindhi', 'si': 'sinhala', 'sk': 'slovak', 'sl': 'slovenian', 'so': 'somali', 'es': 'spanish', 'su': 'sundanese', 'sw': 'swahili', 'sv': 'swedish', 'tg': 'tajik', 'ta': 'tamil', 'te': 'telugu', 'th': 'thai', 'tr': 'turkish', 'uk': 'ukrainian', 'ur': 'urdu', 'ug': 'uyghur', 'uz': 'uzbek', 'vi': 'vietnamese', 'cy': 'welsh', 'xh': 'xhosa', 'yi': 'yiddish', 'yo': 'yoruba', 'zu': 'zulu'}

Googletrans ile çeviri, dil algılama gibi temel işlemleri yapabilmek için aşağıdaki adımları uygulayalım.

#Çevirmen ataması yapıldı
translator = googletrans.Translator()

#Çevrilecek cümle ataması yapıldı
text="Yapay zeka konularının temelinde istatistik yatmaktadır."

#translate komutu ataması yapldı
#dest: hangi dile çeviri yapılacaksa o belirtilir. Varsayılan olarak ingilizcedir("en").
translation = translator.translate(text, dest='en')
  • Girdi yapılan cümlenin hangi dilde olduğu - src;
    translation.src

    Çıktı:

    'tr'
  • Çeviri yapılacak dil - dest;
    translation.dest

    Çıktı:

    'en'
  • Çeviri işlemi - text;
    translation.text

    Çıktı:

    'Statistics lie on the basis of artificial intelligence issues.'

Örnek-1: "Yapay zekânın doğuşu günümüzde insanlar tarafından oldukça yakın tarihli olarak düşünülmektedir. Ancak, yapay zekâ terminin dünya literatürüne evrensel bir şekilde ilk girdiği zaman (Dartmouth Konferansı) 1956 yılına dayanmaktadır. 1956 yılından önce ise, geçmiş yazıtlarda ve kaynaklarda (resim, heykel vb.) incelemeler gerçekleştiren araştırmacılar, eski medeniyetler olarak bilinen Antik Yunan ve Çin Mitlerinde, insanlarının yapay zekâ ile dolaylı bir bağlantı içinde olduğunu düşündürmüştür." cümlesini hangi dile çevrileceğini isteyen bir fonksiyon yazarak çeviri sonucunu döndürelim.

#Çeviri fonksiyonu
def Translate(text,lang):
    import googletrans
    translator=googletrans.Translator()
    translation=translator.translate(text,dest=lang)
    return translation.text
#Çeviri yapılacak cümle.
text="""
Yapay zekânın doğuşu günümüzde insanlar tarafından oldukça yakın tarihli olarak düşünülmektedir. Ancak, yapay zekâ terminin dünya literatürüne evrensel bir şekilde ilk girdiği zaman (Dartmouth Konferansı) 1956 yılına dayanmaktadır. 1956 yılından önce ise, geçmiş yazıtlarda ve kaynaklarda (resim, heykel vb.) incelemeler gerçekleştiren araştırmacılar, eski medeniyetler olarak bilinen Antik Yunan ve Çin Mitlerinde, insanlarının yapay zekâ ile dolaylı bir bağlantı içinde olduğunu düşündürmüştür.
"""
#İngilizce'ye çevildi
Translate(text,"en")

Çıktı:

'The nature of artificial intelligence is considered to be very closely dated by people today.However, when the term of artificial intelligence is universally first entered the world literature (Dartmouth Conference) is based on 1956.Prior to 1956, researchers performing investigators in past inscriptions and resources (pictures, sculptures, etc.), known as ancient Greek and Chinese myths, known as ancient civilizations, has been in an indirect connection with artificial intelligence.'
#Arapça'ya çevildi
Translate(text,"ar")

Çıktı:

'يعتبر طبيعة الذكاء الاصطناعي أن يكون مؤرما وثيقا من قبل الناس اليوم.ومع ذلك، عندما دخلت مصطلح الذكاء الاصطناعي لأول مرة في العالم لأدب العالم (مؤتمر دارتموث) على أساس عام 1956.قبل عام 1956، كان الباحثون الذين يقومون إجراء محققين في النقوش والموارد السابقة (الصور، المنحوتات، وما إلى ذلك)، المعروفة باسم الأساطير اليونانية والصينية القديمة، المعروفة باسم الحضارات القديمة، كانت في صلة غير مباشرة مع الذكاء الاصطناعي.'
#Japonca'ya çevildi
Translate(text,"ja")

Çıktı:

'人工知能の性質は、今日の人々によって非常に密接に日付があると考えられています。しかし、人工知能の期間が普遍的に最初に世界文学(ダートマスカンファレンス)に入学したときは1956年に基づいています。1956年以前は、古代の文明として知られている古代ギリシャや中国の神話として知られる、過去の碑文や資源(写真、彫刻など)で研究者を演じる研究者たちは、人工知能との間接的なつながりになっています。'
Paylaş:

Yorum Yap (*Yorumunuza kod eklemek isterseniz Kod Parçacığı Ekle butonuna tıklayarak ekleyebilirsiniz.)

Yorumlar

Henüz hiç yorum yapılmamış, ilk yorum yapan sen ol.