İçeriğe atla

Zemberek

Eskiden takip ettiğim ama sonra okumayı bıraktığım RSS feedlerini okumaya Operayı yükleyerek yeniden başladım. Yeni kaydolduğum feedlerle şu anda 90’ın üstünde blog ve haber kaynağından gelen haberleri günlük olarak takip ediyorum. Bugün hangi bloglarda güncellemeler var diye bakarken, fazlamesai.net’te yayınlanan Zemberek yazısını gördüm. İsminden Pardusla birlikte başlayan türkçe projelerden birisi olduğunu tahmin etsem de merak içinde okumaya başladım. Yazıda Zemberek projesinde üzerinde çalıştıkları bir mevzuyu konu ediyorlardı ama ben projenin sayfasına geçip oradan ne olduğunu anlamaya karar verdim. Kısa bir bilgi vermek gerekirse, Zemberek bir NLP (natural language processin – doğal dil işleme) projesi. NLP’nin tanımı türkçe wikipedia’da:
NLP yani Doğal Dil İşleme, doğal dillerin kurallı yapısının çözümlenerek anlaşılması veya yeniden üretilmesi amacını taşır.Bu çözümlemenin insana getireceği kolaylıklar, yazılı dokümanların otomatik çevrilmesi, soru-cevap makineleri, otomatik konuşma ve komut anlama, konuşma sentezi, konuşma üretme, otomatik metin özetleme, bilgi sağlama gibi birçok başlıkla özetlenebilir.

NLP’nin ne olduğuyla ve amacıyla ilgili kısa bir özet geçmek gerekirse, “insanların konuştuğu dilleri bilgisayar ortamına aktarmak ve bilgisayarlar tarafından dilin morfolojisinin tanınabilmesi ve diller arasında otomatik olarak dönüşümler yapılmasını sağlamak.”

Bildiğim kadarıyla, Zemberek projesine kadar Microsoft Office ürün ailesiyle gelen türkçe denetim aracından başka yazılmış türkçe dil denetim veya türkçe kelimeleri tanıma projesi bulunmuyordu. Zemberek projesi, hem açık kodlu olması hem de bu alanda bir ilke imza atması yönüyle bence çok güzel bir çalışma olmuş ve daha sevindiri olanı ise üzerinde halen çalışma yapılıp mesafe katediliyor.

NLP alanında bilimsel bir deneyimim olmasa da php’de kendi çapımda birşeyler kodlamaya çalışmıştım birkaç ay evvel. Başlangıçta kolay gibi gözüken eklere ayırma yada ismin hallerini tanıma işlemi bile işin içine girdikten sonra ne kadar dallanıp budaklanıyor, türkçeye sonradan giren yabancı kelimelerdir, a ile başlayıp e ile biten kelimelerdir derken işin içinden çıkamadım. Bu projeyi bulmama vesile olan “Sözlük ve Kök ağacı” ile ilgili yazıyı okuyunca, benim yaptığım gibi kelimeleri ekleriyle ele almak değil kökten başlamak gerektiğini de anlamış oldum 🙂 Zemberek projesi şu anda Pardusta aktif olarak kullanılıyor, NZemberek versiyonuyla da Windows ortamına aktarılmaya çalışılıyor.

Zemberek projesinin Türkiye ve Türkçe için önemi
Zemberk’in öneminden bahsetmeden edemeyeceğim. Bu proje bana göre çok önemli çünkü şu anda google’ın translation servisinden tutun, altavista’nın babelfishine kadar otomatik dil çevirisi yapan dil araçları türkçeyi tanımıyor. Yahudilerin konuştuğu hibru (hebrew)’dan tutun rumcaya danimarkalıların ve finlandiyalıların dillerine kadar çeviriler yapılırken, dünya üzerinde 200-300 milyon insanın konuştuğunu söylediğimiz Türkçeyi başka dillere çevirme seçeneği bulunmuyor. Bunun uzaylılar tarafından bizim için yapılmasını beklemek hüsrandan başka bişey olmayacaktır 🙂 Bu noktada Zemberek çok önemli bir adım. Bu proje gelişip bu noktalara ulaşırsa, Türkçe gerçekten dünya dilleri arasına girmiş olacaktır. İngilizceden türkçeye, türkçeden ingilizceye çeviriler otomatik olarak google translation veya altavista babelfish tarafından gerçekleştirilecektir. Hatta bu konuda bu sitelere alternatif bir türk sitesi çıkması çok daha güzel olur. Bu sayede örneğin, okuduğunuz bu yazı İngilizceye çevrilmek suretiyle milyonlar tarafından okunabilir. Aynı şekilde, ingilizce bilmeyen birçok kimse, bir tuş ile ingilizce siteleri türkçeye çevirerek orada bahsi geçen konuları birebir okuyabilecektir. Şahsi düşüncem, bunu gerçekleştirecek bir proje Tübitak veya Kültür bakanlığı tarafından desteklenmek suretiyle gündeme alınmalı ve en kısa sürede tamamlanıp tanıtılmaya başlanmalıdır. Milyonlarca doları Türkiye’nin tanıtımına ayırmak yerine, milyonlarca insanın kullandığı interneti araç olarak kullanmak çok daha efektif olacaktır. Türkiye’nin dünyayla daha iyi entegre olmasına çok büyük katkı sağlayacaktır.

Son söz olarak, proje geliştiricilerine canı gönülden teşekkür ediyorum ve başarılar diliyorum. Katkımız olacak bir konu olursa gönüllü olduğumuzu da buradan dile getirmek istiyorum.

Zemberek” üzerine bir yorum

  1. Mustafa der ki:

    Her ne kadar çok iyi olmasa da Ingilizceden Türkce`ye ceviri sitesi mevcut. Ama ben daha tersini yapani bulamadim. Bilmeyenleri bilgilendirmek yardimci olmak amaciyla adresi vereyim.

    http://www.hemencevir.com

    Bu projeyi bende destekliyorum ve elimden geleni cani gönülden yapacagimi belirtmek istiyorum…

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Time limit is exhausted. Please reload CAPTCHA.

css.php