Ékezetek automatikus helyreállítása magyar nyelvű szövegekben

Cikkünkben egy olyan rendszert mutatunk be, ami a statisztikai gépi fordítás módszereit használva megbízhatóan pótolja a hiányzó ékezeteket ékezetek nélkül írt magyar nyelvű szövegekben. Mivel magyar nyelv esetén elkerülhetetlen, hogy igen nagyméretű szöveges tanítókorpusz alkalmazása esetén is hián...

Teljes leírás

Elmentve itt :
Bibliográfiai részletek
Szerzők: Novák Attila
Siklósi Borbála
Testületi szerző: Magyar Számítógépes Nyelvészeti Konferencia (12.) (2016) (Szeged)
Dokumentumtípus: Könyv része
Megjelent: 2016
Sorozat:Magyar Számítógépes Nyelvészeti Konferencia 12
Kulcsszavak:Nyelvészet - számítógép alkalmazása
Online Access:http://acta.bibl.u-szeged.hu/58961
Leíró adatok
Tartalmi kivonat:Cikkünkben egy olyan rendszert mutatunk be, ami a statisztikai gépi fordítás módszereit használva megbízhatóan pótolja a hiányzó ékezeteket ékezetek nélkül írt magyar nyelvű szövegekben. Mivel magyar nyelv esetén elkerülhetetlen, hogy igen nagyméretű szöveges tanítókorpusz alkalmazása esetén is hiányozzanak bizonyos szóalakok a tanítóanyagból, morfológiai elemzőt integráltunk a rendszerbe, ami ékezetesített szóalakjelölteket generál ezekhez a szavakhoz. Az így létrejött rendszert kiértékelve a rendszer az esetek több mint 99%-ában helyes ékezetes alakot állított elő.
Terjedelem/Fizikai jellemzők:49-58
ISBN:978-963-306-450-4