Értsük meg a magyar entitásfelismerő rendszerek viselkedését!

A nyelvtechnológiai megoldásokat hagyományosan egy valós életből származó szöveghalmaz tanító és tesztadatbázisra bontott verzióján szokás kiértékelni, e módszer azonban több buktatóval is rendelkezik. A CheckList egy újfajta kiértékelési módszertan, mely különböző nyelvi jelenségeket definiál, tová...

Teljes leírás

Elmentve itt :
Bibliográfiai részletek
Szerzők: Farkas Richárd
Nemeskey Dávid Márk
Zahorszki Róbert
Vincze Veronika
Testületi szerző: Magyar számítógépes nyelvészeti konferencia (17.) (2021) (Szeged)
Dokumentumtípus: Könyv része
Megjelent: 2021
Sorozat:Magyar Számítógépes Nyelvészeti Konferencia 17
Kulcsszavak:Nyelvészet - számítógép alkalmazása
Tárgyszavak:
Online Access:http://acta.bibl.u-szeged.hu/73378
Leíró adatok
Tartalmi kivonat:A nyelvtechnológiai megoldásokat hagyományosan egy valós életből származó szöveghalmaz tanító és tesztadatbázisra bontott verzióján szokás kiértékelni, e módszer azonban több buktatóval is rendelkezik. A CheckList egy újfajta kiértékelési módszertan, mely különböző nyelvi jelenségeket definiál, továbbá az egyes jelenségekre külön tesztkörnyezeteket állít fel, melyek az adott alkalmazás viselkedését hivatottak tesztelni. Ebben a tanulmányban a magyar nyelvű névelem-felismerési (NER) feladatra alkalmazzuk a CheckList módszertanát. Ehhez 9 nyelvi jelenséget1 definiálunk, mondatsablonokon keresztül 27 tesztkörnyezetet állítunk fel és három magyar névelem-felismerő rendszert értékelünk ki a CheckList módszertanában. Elemzésünk megmutatja, hogy ez a módszertan közelebb visz minket ahhoz, hogy megértsük a magyar entitásfelismerők viselkedésének megértését.
Terjedelem/Fizikai jellemzők:319-329
ISBN:978-963-306-781-9