Thread overview
Çeviri sistemi için veritabanı
Oct 02, 2017
Abdullah
Oct 02, 2017
erdem
Oct 02, 2017
kerdemdemir
Oct 02, 2017
Abdullah
October 02, 2017

Bir çeviri uygulaması yapmak istiyorum. Veritabanı noktasında bazı sıkıntılarım var.
Birbiriyle bağlantılı olan kelimeler nasıl gruplandirilabilir?
Mesela, "ben" "beni" "bana" gibi.

Eş anlamlı kelimeler için ne yapılabilir?
(Sorgu yaparken)

Bu gibi sorunlar için yeni bir veritabanı yönetim sistemi tasarlamama gerek var mı?

--
[ Bu gönderi, http://ddili.org/forum'dan dönüştürülmüştür. ]

October 02, 2017

Aslında veritabanından ziyade kullanacağın veri yapısını seçmen gerekir.

Bunun için de disjoint set veri yapısını kullanabilirsin.

https://www.topcoder.com/community/data-science/data-science-tutorials/disjoint-set-data-structures/

Sanırım bu da aynı konuyu anlatıyor.

http://algs4.cs.princeton.edu/15uf/

Bu veri yapısını kullanan örnek bir uygulama

https://www.youtube.com/watch?v=DsfMcQMwPcI

Bu veri yapısının nasıl kullanıldığını daha önce konuşmuşuz.

http://ddili.org/forum/post/7773

http://ddili.org/forum/post/7785

--
[ Bu gönderi, http://ddili.org/forum'dan dönüştürülmüştür. ]

October 03, 2017

Aynen bu eki anlama isi cok cetrefilli bir is.

Bu konu basli basina bir arastirma konusu. Benim 5 sene once aldigim NLP dersimden aklimda kaldigi kadariyla Parse Tree diye veri yapilari vardi once kelimenin ozne mi fiil mi nesne mi oldugunu anliyorduk. Bu noktadan sonradan baska veri yapilari ile ekleri anlamlandiriyorduk.

Benim hocam baya bir ugrasmisti bunlarla. Makaleler hep ingilizce turkcelerini bulamadim uzgunum.

https://link.springer.com/chapter/10.1007/978-3-319-22635-4_31
http://www.aclweb.org/anthology/J08-3003

Saygilar

--
[ Bu gönderi, http://ddili.org/forum'dan dönüştürülmüştür. ]

October 03, 2017

Herkese teşekkürler. İnglizcem yeterli seviyede değil malesef. Hem yeni şeyler öğrenerek değil de, mevcut bilgilerimle bu uygulamayı geliştirmek istiyorum.

Geçen dizi'nin ram'de kapladığı alanla ilgili bir soru sormuştum. Bunun sebebi aklımdaki düz-dosya veritabanı tasarımıydı. Yani dosyadaki elemanlar diziye aktarıldığında kaç mb yer kaplar merak etmiştim.

Ama şimdi buna da şöyle bi çözüm buldum (belki komik gelebilir bunlar); dosyadan satır satır okunacak ve aynı sabit~ diziye aktarılacak. Mesela sorguda ilk satır okunuyor, diziye aktarılıyor dizide sorgu yapılıyor, sorgu bulunamazsa ikinci satır aynı diziye aktarılıyor... Böylece ram'de kaplayacağı alanı da hemen hemen kontrol edebileceğim.

--
[ Bu gönderi, http://ddili.org/forum'dan dönüştürülmüştür. ]

October 02, 2017

Alıntı (Abdullah):

>

Mesela, "ben" "beni" "bana" gibi.

Türkçe'nin ekler şampiyonu olduğunu düşünürsek o işin sonu yok. :)

Alıntı:

>

Eş anlamlı kelimeler için ne yapılabilir?

Benim fazla bilgim yok ama bu sorunların Google gibi firmalar tarafından yeterince çözüldüğünü biliyoruz.

Alıntı:

>

Bu gibi sorunlar için yeni bir veritabanı yönetim sistemi tasarlamama gerek var mı?

Sanırım kendi verini kendin halletmek isteyeceksin. Daha geçen gün bir arkadaşla ilgisiz bir konuda konuşuyorduk: Ne zaman bir veri tabanı programı kullanmaya kalksalar eninde sonunda onu bırakıp kendi çözümlerini yazmak zorunda kalmışlar. Bunun nedeni, genel kullanımı hedefleyen veri tabanlarının özel amaçlarda yavaş kalabilmesi... Tabii sen de hazır bir veri tabanıyla başlayıp gerekirse başka bir şeyler yazabilirsin.

Ali

--
[ Bu gönderi, http://ddili.org/forum'dan dönüştürülmüştür. ]