ASR-hibaterjedés vizsgálata a gépi beszédértés szemszögéből

Napjainkban a mesterséges intelligencia alapú megoldások egyre inkább a beszélt nyelv gépi megértésére törekednek. Ennek preferált megközelítése az, amikor automatikus beszédfelismerő (ASR) rendszerek használatával átiratokat hozunk létre, amelyek további, szövegalapú elemzésen mennek keresztül. A g...

Teljes leírás

Elmentve itt :
Bibliográfiai részletek
Szerzők: Tündik Máté Ákos
Szaszák György
Testületi szerző: Magyar Számítógépes Nyelvészeti Konferencia (16.) (2020) (Szeged)
Dokumentumtípus: Könyv része
Megjelent: 2020
Sorozat:Magyar Számítógépes Nyelvészeti Konferencia 16
Kulcsszavak:Nyelvészet - számítógép alkalmazása
Online Access:http://acta.bibl.u-szeged.hu/67666
LEADER 02150naa a2200217 i 4500
001 acta67666
005 20221108114919.0
008 200505s2020 hu o 1|| zxx d
020 |a 978-963-306-719-2 
040 |a SZTE Egyetemi Kiadványok Repozitórium  |b hun 
041 |a zxx 
100 1 |a Tündik Máté Ákos 
245 1 0 |a ASR-hibaterjedés vizsgálata a gépi beszédértés szemszögéből  |h [elektronikus dokumentum] /  |c  Tündik Máté Ákos 
260 |c 2020 
300 |a 245-257 
490 0 |a Magyar Számítógépes Nyelvészeti Konferencia  |v 16 
520 3 |a Napjainkban a mesterséges intelligencia alapú megoldások egyre inkább a beszélt nyelv gépi megértésére törekednek. Ennek preferált megközelítése az, amikor automatikus beszédfelismerő (ASR) rendszerek használatával átiratokat hozunk létre, amelyek további, szövegalapú elemzésen mennek keresztül. A gépi átiratok szóhibákat is tartalmazhatnak; ezen hibák továbbterjednek a szöveges feldolgozási folyamatba, így a gépi központozásba, kivonatolásba is. Ugyanakkor szubjektív tesztjeink azt igazolták, hogy az emberek a gépi átiratokat a szóhibák és a központozási hibák ellenére is jól tudják értelmezni. Célunk az, hogy bemutassuk az ASR-hibaterjedésből adódó, szemantikai térben bekövetkező információveszteségeket, valamint az ASR-hibaterjedés automatikus összefoglalásra gyakorolt hatását is elemezzük. Bemutatjuk, hogy az egyes mondatreprezentációk a szóhibák hatására enyhén eltolódnak a szemantikai térben, de ez jócskán elmarad a dokumentum mondatainak átlagos szemantikai távolságától. Megmutatjuk azt is, hogy a központozás hibáinak nagyobb hatása van az összefoglalók kiértékelésére, mint a szóhibáknak, ami arra enged következtetni, hogy a feladathoz elengedhetetlen a megfelelő mondatszintű tokenizálás. 
695 |a Nyelvészet - számítógép alkalmazása 
700 0 1 |a Szaszák György  |e aut 
710 |a Magyar Számítógépes Nyelvészeti Konferencia (16.) (2020) (Szeged) 
856 4 0 |u http://acta.bibl.u-szeged.hu/67666/1/msznykonf_016_245-257.pdf  |z Dokumentum-elérés