Doğal Dil İşleme

Doğal dil işleme nedir?

2013 yılının özgün senaryo ödüllerini toplayan “her” filminde yapay zeka işletim sistemi olan ve sadece sesten oluşan Samantha isimli bir yazılım Theodor’a arkadaşlık etmektedir. Yani Theodor’la konuşmakta, sohbet etmekte hatta Theodor zamanla Samantha’ya aşık bile olmaktadır. Peki böyle bir şey mümkün olabilir mi? Bir makine sizinle iletişim kurabilir mi ? Sizin yazdıklarınızı, söylediklerinizi anlayıp size cevaplar verebilir mi ? Doğal dil işleme ile neden olmasın!

1950’ lerde yapay zekanın alt kolu olarak ortaya çıkan doğal dil işleme (NLP), makine öğrenmesi ile dil bilimini kullanarak yazı ya da konuşmayı işleyip bilgiye dönüştürmeyi amaçlamıştır. Yani bilgisayar ile doğal dilde iletişimin sağlanması amaçlanmıştır. Uzun yıllardır üzerinde çalışmalar yapılan NLP’nin en etkileyici yanı da günlük hayatın bir çok alanında bulunmasıdır. NLP’nin bazı kullanım alanlarını göz gezdirmek gerekirse:

Makine çevirisi

NLP’ nin yaygın bir şekilde kullanıldığı alanlardan biri makine çevirisidir. Girdiğimiz internet sitelerindeki dil değiştirme bölümleri ya da google-translete gibi çeviri sayfaları NLP’ den oldukça yararlanmaktadır. Bahsettiğimiz gibi NLP, dillerin yapısını çözümleyip dillerin anlaşılmasını ve yeniden üretilmesini sağlar. Bundan dolayı çeviri sayfalarında çevrilecek cümlenin dil kuralına ve imla kurallarına uygun yazılması daha iyi sonuç alınmasına yardımcı olur.

Otomatik özet çıkarma

Bir diğer kullanım alanı olan otomatik özet çıkarımında ise bir metnin içinden yararlı olacak bilgilerin saptanıp, metnin özetinini çıkarılması gerçekleştirilir. Örneğin işyerinden toplantı ile ilgili aldığınız bir e-posta içerisinden toplantı zamanının çıkarılması gibi. Buradaki sistem, düz metin içerisinden kopyalama yapmamaktadır; sistem, çıkardığı özeti kendi cümleleriyle kullanıcıya aktarmaktadır.

Duygu analizi

Duygu analizinde, verilen metnin öznel bilgisi çıkarılmaktadır. Bu bilgi bir yargı, fikir olabileceği gibi bir duygu da olabilir. Örnek olarak verilen metnin olumlu mu yoksa olumsuz mu olduğunun tespit edilmesini gösterebiliriz. Firmaların/kişilerin medya araştırmalarında kendileri ile ilgili yazılanları takip edebilmek için de duygu analizi kullanılmaktadır. Burada sistem, firma/kişi ile ilgili yazıları kullanıcıya gösterirken ilgisiz yazıları göstermemektedir.

Metin sınıflandırması

Metin sınıflandırması çalışmalarında ise verilen bir metnin ne ile ilgili olduğu araştırılmaktadır. Bir e-posta’ nın spam olup olmadığı, bir haber metninin ne ile ilgili olduğu (spor, siyaset, ekonomi…) ya da bir kitabın/sözün hangi yazara ait olduğu gibi çalışmalar örnek olarak gösterilebilir.

 ve diğerleri

NLP’ nin kullanıldığı bir çok alan daha vardır. En basitinden telefonlarımızda, e-postalarımızda yazdığımız yazıları otomatik düzelten programlar da arka planında NLP kullanmaktadır. 1966 yılında Joseph Weizenbaum’ ın yazdığı NLP tabanlı ELİZA sohbet programı ile bir kullanıcı arasında geçen sohbete bakalım:

Konuşmacı: Erkekler hep aynı.

ELIZA: Hangi açıdan?
Konuşmacı: Bizi her zaman kızdırıyorlar.
ELIZA: Belirli bir örnek verebilir misin?
Konuşmacı: Kocam beni hep kızdırıyor.
ELIZA: Kocan seni hep kızdırıyor.
Konuşmacı: Benim her zaman depresyonda olduğumu söylüyor.
ELIZA: Depresyonda olduğunu duyduğuma çok üzüldüm.
Konuşmacı: Doğru, çok mutsuzum.
ELIZA: Sence buraya gelmek mutlu olmana yardımcı olacak mı?
Konuşmacı: Yardımcı olacağını düşünüyorum.

Buradaki sohbette konuşmacı ELİZA bilgisayar programına bazı sorular soruyor, program tıpkı gerçek bir insan gibi cevap verip konuşmacı ile sohbet ediyor.

Peki ama nasıl ?

Bilgisayarlar tabiki de onlarla iletişim kurmamızı, neler dediğimizi anlamıyorlar ancak bunu makina dilinde anlamlandırabilmek mümkün olabiliyor. Fazla derine inmeden basitçe arka planda neler olduğuna bakabiliriz… NLP sisteminin arkasında da yapay zekanın temeli olan makina öğrenmesi teknolojisi yatıyor. Bilgisayar, kendisine gelen metinleri cümlelere, cümleleri kelimelere hatta kelimeleri bile en basit (ek almamış) hallerine çeviriyor. Bu kelimelerin yapıları (sıfat, fiil, isim…) tespit edilip dilin yapısı üzerinden inceleniyor ve metin içerisinden bilgi/özellik çıkarımı yapılıyor.  Bu metinler bilgisayarın çalışabileceği sayısal değerlere getirildikten sonra da makina öğrenmesinin sihirli dünyasında dil biliminin yapısı bilgisayara öğretiliyor.

Sona doğru

Gelişimini halen sürdürmekte olan NLP, gün geçtikçe hayatımıza daha fazla girmekte ve kullanım alanlarıya bize kolaylıklar sağlamaktadır. ELİZA ve Samantha örneklerinde olduğu gibi bilgisayarlarla/robotlarla iletişim mümkün görülüyor. Acaba gelecekte bu sistemler kendi fikirlerini de üretmeye başlarlar mı? Ya da duygu sahibi olabilirler mi? Peki ya Samantha da Theodor’ a aşık olursa? Bakalım gelecek bize neler gösterecek…

İsmail Yılmaz

Leave a Comment