ka | en
ავტორიზაცია
ტექსტური ინფორმაციის ავტომატური დამუშავების მოდული ქართული ენის GeWordNet თესაურუსისთვის
ავტორი: ლიანა ლორთქიფანიძესაკვანძო სიტყვები: ელექტრონულ სიტყვათა ქსელი - WordNet, ტექსტის ავტომატური დამუშავება, სინსეტი, GeWordNet თესაურუსი
ანოტაცია:
წარმოდგენილ სამუშაოში განვიხილავთ ქართული GeWordNet-ის მონაცემთა ბაზების ნაწილობრივ ავტომატურად ფორმირების მიდგომას. ძირითადი იდეა მდგომარეობს ინგლისური სინსეტების შესაბამისი ქართული შესატყვისით ჩანაცვლებაში. ამავდროულად არ უნდა დაირღვეს სემანტიკური ქსელის სტრუქტურა. ზოგ შემთხვევაში ასეთი ჩანაცვლების განხორციელება შესაძლებელია ავტომატურად, ვინაიდან ინგლისური სიტყვებისა და კოლოკაციების უბრალო ჩანაცვლება კი არ უნდა მოხდეს ქართულით, არამედ მხოლოდ ისეთი სიტყვების, რომლებიც სინონიმურად არიან ერთმანეთთან დაკავშირებული. საწყის მონაცემთა ბაზად გამოიყენება English Princeton WordNet. მოხსენებაში განხილული და გაანალიზებული იქნება ასეთი მიდგომის დადებითი და უარყოფითი მხარეები.
მიმაგრებული ფაილები:
Lortkipanidze_Eng [ka]Lortkipanidze [ka]