Kombinált központozási megoldások magyar nyelvre pehelysúlyú neurális hálózatokkal
Napjainkban a rekurrens neurális hálókon alapuló szekvenciamodellezés hatékony eszköznek bizonyult több, a természetesnyelv-feldolgozás (NLP) témaköréhez tartozó probléma megoldásában. Ide sorolhatjuk az írásjelek gépi úton történő visszaállítását, vagyis az automatikus központozást is, melynek sorá...
Elmentve itt :
Szerzők: | |
---|---|
Testületi szerző: | |
Dokumentumtípus: | Könyv része |
Megjelent: |
2019
|
Sorozat: | Magyar Számítógépes Nyelvészeti Konferencia
15 |
Kulcsszavak: | Nyelvészet - számítógép alkalmazása |
Online Access: | http://acta.bibl.u-szeged.hu/59092 |
LEADER | 01924naa a2200217 i 4500 | ||
---|---|---|---|
001 | acta59092 | ||
005 | 20221108114922.0 | ||
008 | 190703s2019 hu o 1|| zxx d | ||
020 | |a 978-963-315-393-2 | ||
040 | |a SZTE Egyetemi Kiadványok Repozitórium |b hun | ||
041 | |a zxx | ||
100 | 1 | |a Tündik Máté Ákos | |
245 | 1 | 0 | |a Kombinált központozási megoldások magyar nyelvre pehelysúlyú neurális hálózatokkal |h [elektronikus dokumentum] / |c Tündik Máté Ákos |
260 | |c 2019 | ||
300 | |a 275-286 | ||
490 | 0 | |a Magyar Számítógépes Nyelvészeti Konferencia |v 15 | |
520 | 3 | |a Napjainkban a rekurrens neurális hálókon alapuló szekvenciamodellezés hatékony eszköznek bizonyult több, a természetesnyelv-feldolgozás (NLP) témaköréhez tartozó probléma megoldásában. Ide sorolhatjuk az írásjelek gépi úton történő visszaállítását, vagyis az automatikus központozást is, melynek során a szó- és/vagy akusztikai eseménysorozathoz írásjeleket rendelünk. Ezt a technikát pl. a beszédfelismerő központozatlan kimenetére alkalmazva a szöveg sokkal olvashatóbbá, érthetőbbé válik. Cikkünkben pehelysúlyú kombinált központozási megoldásokat mutatunk be, melyhez karakter- és szószintű beágyazás (embedding) vektorokat, valamint egy 39 dimenziós akusztikai jellemzővektort is felhasználunk. Kísérleteinket két magyar nyelvű, hírműsorokat, illetve felolvasást tartalmazó korpuszon végeztük el. Eredményeinkkel igazoljuk, hogy a kombinált módszerekkel hatékonyabb tud lenni az írásjelek visszaállítása, mintha csak egy-egy szöveges vagy akusztikus komponensre támaszkodnánk. | |
695 | |a Nyelvészet - számítógép alkalmazása | ||
700 | 0 | 1 | |a Szaszák György |e aut |
710 | |a Magyar Számítógépes Nyelvészeti Konferencia (15.) (2019) (Szeged) | ||
856 | 4 | 0 | |u http://acta.bibl.u-szeged.hu/59092/1/msznykonf_015_275-286.pdf |z Dokumentum-elérés |