Kombinált központozási megoldások magyar nyelvre pehelysúlyú neurális hálózatokkal

Napjainkban a rekurrens neurális hálókon alapuló szekvenciamodellezés hatékony eszköznek bizonyult több, a természetesnyelv-feldolgozás (NLP) témaköréhez tartozó probléma megoldásában. Ide sorolhatjuk az írásjelek gépi úton történő visszaállítását, vagyis az automatikus központozást is, melynek sorá...

Teljes leírás

Elmentve itt :
Bibliográfiai részletek
Szerzők: Tündik Máté Ákos
Szaszák György
Testületi szerző: Magyar Számítógépes Nyelvészeti Konferencia (15.) (2019) (Szeged)
Dokumentumtípus: Könyv része
Megjelent: 2019
Sorozat:Magyar Számítógépes Nyelvészeti Konferencia 15
Kulcsszavak:Nyelvészet - számítógép alkalmazása
Online Access:http://acta.bibl.u-szeged.hu/59092
LEADER 01924naa a2200217 i 4500
001 acta59092
005 20221108114922.0
008 190703s2019 hu o 1|| zxx d
020 |a 978-963-315-393-2 
040 |a SZTE Egyetemi Kiadványok Repozitórium  |b hun 
041 |a zxx 
100 1 |a Tündik Máté Ákos 
245 1 0 |a Kombinált központozási megoldások magyar nyelvre pehelysúlyú neurális hálózatokkal  |h [elektronikus dokumentum] /  |c  Tündik Máté Ákos 
260 |c 2019 
300 |a 275-286 
490 0 |a Magyar Számítógépes Nyelvészeti Konferencia  |v 15 
520 3 |a Napjainkban a rekurrens neurális hálókon alapuló szekvenciamodellezés hatékony eszköznek bizonyult több, a természetesnyelv-feldolgozás (NLP) témaköréhez tartozó probléma megoldásában. Ide sorolhatjuk az írásjelek gépi úton történő visszaállítását, vagyis az automatikus központozást is, melynek során a szó- és/vagy akusztikai eseménysorozathoz írásjeleket rendelünk. Ezt a technikát pl. a beszédfelismerő központozatlan kimenetére alkalmazva a szöveg sokkal olvashatóbbá, érthetőbbé válik. Cikkünkben pehelysúlyú kombinált központozási megoldásokat mutatunk be, melyhez karakter- és szószintű beágyazás (embedding) vektorokat, valamint egy 39 dimenziós akusztikai jellemzővektort is felhasználunk. Kísérleteinket két magyar nyelvű, hírműsorokat, illetve felolvasást tartalmazó korpuszon végeztük el. Eredményeinkkel igazoljuk, hogy a kombinált módszerekkel hatékonyabb tud lenni az írásjelek visszaállítása, mintha csak egy-egy szöveges vagy akusztikus komponensre támaszkodnánk. 
695 |a Nyelvészet - számítógép alkalmazása 
700 0 1 |a Szaszák György  |e aut 
710 |a Magyar Számítógépes Nyelvészeti Konferencia (15.) (2019) (Szeged) 
856 4 0 |u http://acta.bibl.u-szeged.hu/59092/1/msznykonf_015_275-286.pdf  |z Dokumentum-elérés