Charmen ELECTRA - tokenizációmentes diszkriminatív nyelvi modellezés

Napjainkban a természetesnyelv-feldolgozás területén használt neurális modellek többsége előre definiált szótöredékekből kialakított szótárakkal dolgozik. A kötött szótár használatának eredményeképp az ezekre építő modellek érzékenyek a zajra, doménadaptációjuk költségesebb lehet, ezen felül többnye...

Teljes leírás

Elmentve itt :

Bibliográfiai részletek
Szerzők:	Ficsor Tamás Cserháti Réka Novák Attila Mihajlik Péter Zainkó Csaba Berend Gábor
Testületi szerző:	Magyar számítógépes nyelvészeti konferencia (18.) (2022) (Szeged)
Dokumentumtípus:	Könyv része
Megjelent:	2022
Sorozat:	Magyar Számítógépes Nyelvészeti Konferencia 18
Kulcsszavak:	Nyelvészet - számítógép alkalmazása
Tárgyszavak:	Természettudományok Számítás- és információtudomány Bölcsészettudományok Nyelvek és irodalom
Online Access:	http://acta.bibl.u-szeged.hu/75864

Leíró adatok
Tartalmi kivonat:	Napjainkban a természetesnyelv-feldolgozás területén használt neurális modellek többsége előre definiált szótöredékekből kialakított szótárakkal dolgozik. A kötött szótár használatának eredményeképp az ezekre építő modellek érzékenyek a zajra, doménadaptációjuk költségesebb lehet, ezen felül többnyelvű modellek építése esetén a szótár mérete drasztikusan megnőhet. Ezen problémák orvoslására egy tokenizálómentes ELECTRA architektúrát mutatunk be, amely a Charformer blokkot alkalmazza a tokenizáló modul kiváltására. A modell ∼ 17%-kal kevesebb paramétert tartalmaz, mint a fix szótárral rendelkező társa. Továbbá azonos körülmények között tanított társánál szignifikánsabban jobb eredményt ér el az OpinHuBank adathalmazon. Kutatásunk további eredménye, hogy a huBERT modell finomhangolásával a szentimentosztályozás területén az OpinHuBank adatbázison a korábbi legjobb eredményt meghaladó teljesítményt értünk el.
Terjedelem/Fizikai jellemzők:	45-58
ISBN:	978-963-306-848-9

Charmen ELECTRA - tokenizációmentes diszkriminatív nyelvi modellezés

Hasonló tételek