Közérthetőség mint osztályozási probléma (?) - gépi tanulási kísérlet kézzel címkézett korpuszon

Cikkünkben bemutatjuk a laikusoknak címzett hivatalos szövegek osztályozási kísérletét felügyelt gépi tanuló algoritmusok segítségével. Vizsgálatunkhoz szakértők által, kézzel készített korpuszt használunk, amely közérthetőre fogalmazott és még átfogalmazás előtt álló mondatokat tartalmazott. Célunk...

Teljes leírás

Elmentve itt :
Bibliográfiai részletek
Szerző: Üveges István
Testületi szerző: Magyar számítógépes nyelvészeti konferencia (18.) (2022) (Szeged)
Dokumentumtípus: Könyv része
Megjelent: 2022
Sorozat:Magyar Számítógépes Nyelvészeti Konferencia 18
Kulcsszavak:Nyelvészet - számítógép alkalmazása, Korpusz - nyelvészet
Tárgyszavak:
Online Access:http://acta.bibl.u-szeged.hu/75904
Leíró adatok
Tartalmi kivonat:Cikkünkben bemutatjuk a laikusoknak címzett hivatalos szövegek osztályozási kísérletét felügyelt gépi tanuló algoritmusok segítségével. Vizsgálatunkhoz szakértők által, kézzel készített korpuszt használunk, amely közérthetőre fogalmazott és még átfogalmazás előtt álló mondatokat tartalmazott. Célunk ezzel egy olyan gépi tanult modell készítése, amely alkalmas lehet a szakértők figyelmét felhívni azon mondatokra egy-egy hivatalos szövegben, amelyek további megfontolást érdemelnek a szöveg közérthetőbbre alakítása során, ezzel gyorsítva a szakértői munkát. A kísérletet pilot jelleggel végezzük, az eredmények függvényében korszerűbb módszerek (pl. LSTM, BERT) esetleges kipróbálása előtt, a tapasztalatokat pedig a fentiek szerinti bináris klasszifikációs problémára jellemzően értékeljük.
Terjedelem/Fizikai jellemzők:619-631
ISBN:978-963-306-848-9