ASR-hibaterjedés vizsgálata a gépi beszédértés szemszögéből
Napjainkban a mesterséges intelligencia alapú megoldások egyre inkább a beszélt nyelv gépi megértésére törekednek. Ennek preferált megközelítése az, amikor automatikus beszédfelismerő (ASR) rendszerek használatával átiratokat hozunk létre, amelyek további, szövegalapú elemzésen mennek keresztül. A g...
Elmentve itt :
Szerzők: | |
---|---|
Testületi szerző: | |
Dokumentumtípus: | Könyv része |
Megjelent: |
2020
|
Sorozat: | Magyar Számítógépes Nyelvészeti Konferencia
16 |
Kulcsszavak: | Nyelvészet - számítógép alkalmazása |
Online Access: | http://acta.bibl.u-szeged.hu/67666 |
LEADER | 02150naa a2200217 i 4500 | ||
---|---|---|---|
001 | acta67666 | ||
005 | 20221108114919.0 | ||
008 | 200505s2020 hu o 1|| zxx d | ||
020 | |a 978-963-306-719-2 | ||
040 | |a SZTE Egyetemi Kiadványok Repozitórium |b hun | ||
041 | |a zxx | ||
100 | 1 | |a Tündik Máté Ákos | |
245 | 1 | 0 | |a ASR-hibaterjedés vizsgálata a gépi beszédértés szemszögéből |h [elektronikus dokumentum] / |c Tündik Máté Ákos |
260 | |c 2020 | ||
300 | |a 245-257 | ||
490 | 0 | |a Magyar Számítógépes Nyelvészeti Konferencia |v 16 | |
520 | 3 | |a Napjainkban a mesterséges intelligencia alapú megoldások egyre inkább a beszélt nyelv gépi megértésére törekednek. Ennek preferált megközelítése az, amikor automatikus beszédfelismerő (ASR) rendszerek használatával átiratokat hozunk létre, amelyek további, szövegalapú elemzésen mennek keresztül. A gépi átiratok szóhibákat is tartalmazhatnak; ezen hibák továbbterjednek a szöveges feldolgozási folyamatba, így a gépi központozásba, kivonatolásba is. Ugyanakkor szubjektív tesztjeink azt igazolták, hogy az emberek a gépi átiratokat a szóhibák és a központozási hibák ellenére is jól tudják értelmezni. Célunk az, hogy bemutassuk az ASR-hibaterjedésből adódó, szemantikai térben bekövetkező információveszteségeket, valamint az ASR-hibaterjedés automatikus összefoglalásra gyakorolt hatását is elemezzük. Bemutatjuk, hogy az egyes mondatreprezentációk a szóhibák hatására enyhén eltolódnak a szemantikai térben, de ez jócskán elmarad a dokumentum mondatainak átlagos szemantikai távolságától. Megmutatjuk azt is, hogy a központozás hibáinak nagyobb hatása van az összefoglalók kiértékelésére, mint a szóhibáknak, ami arra enged következtetni, hogy a feladathoz elengedhetetlen a megfelelő mondatszintű tokenizálás. | |
695 | |a Nyelvészet - számítógép alkalmazása | ||
700 | 0 | 1 | |a Szaszák György |e aut |
710 | |a Magyar Számítógépes Nyelvészeti Konferencia (16.) (2020) (Szeged) | ||
856 | 4 | 0 | |u http://acta.bibl.u-szeged.hu/67666/1/msznykonf_016_245-257.pdf |z Dokumentum-elérés |