Közérthetőség mint osztályozási probléma (?) - gépi tanulási kísérlet kézzel címkézett korpuszon
Cikkünkben bemutatjuk a laikusoknak címzett hivatalos szövegek osztályozási kísérletét felügyelt gépi tanuló algoritmusok segítségével. Vizsgálatunkhoz szakértők által, kézzel készített korpuszt használunk, amely közérthetőre fogalmazott és még átfogalmazás előtt álló mondatokat tartalmazott. Célunk...
Elmentve itt :
Szerző: | |
---|---|
Testületi szerző: | |
Dokumentumtípus: | Könyv része |
Megjelent: |
2022
|
Sorozat: | Magyar Számítógépes Nyelvészeti Konferencia
18 |
Kulcsszavak: | Nyelvészet - számítógép alkalmazása, Korpusz - nyelvészet |
Tárgyszavak: | |
Online Access: | http://acta.bibl.u-szeged.hu/75904 |
LEADER | 01894naa a2200253 i 4500 | ||
---|---|---|---|
001 | acta75904 | ||
005 | 20221108114910.0 | ||
008 | 220525s2022 hu o 1|| hun d | ||
020 | |a 978-963-306-848-9 | ||
040 | |a SZTE Egyetemi Kiadványok Repozitórium |b hun | ||
041 | |a hun | ||
100 | 1 | |a Üveges István | |
245 | 1 | 0 | |a Közérthetőség mint osztályozási probléma (?) - gépi tanulási kísérlet kézzel címkézett korpuszon |h [elektronikus dokumentum] / |c Üveges István |
260 | |c 2022 | ||
300 | |a 619-631 | ||
490 | 0 | |a Magyar Számítógépes Nyelvészeti Konferencia |v 18 | |
520 | 3 | |a Cikkünkben bemutatjuk a laikusoknak címzett hivatalos szövegek osztályozási kísérletét felügyelt gépi tanuló algoritmusok segítségével. Vizsgálatunkhoz szakértők által, kézzel készített korpuszt használunk, amely közérthetőre fogalmazott és még átfogalmazás előtt álló mondatokat tartalmazott. Célunk ezzel egy olyan gépi tanult modell készítése, amely alkalmas lehet a szakértők figyelmét felhívni azon mondatokra egy-egy hivatalos szövegben, amelyek további megfontolást érdemelnek a szöveg közérthetőbbre alakítása során, ezzel gyorsítva a szakértői munkát. A kísérletet pilot jelleggel végezzük, az eredmények függvényében korszerűbb módszerek (pl. LSTM, BERT) esetleges kipróbálása előtt, a tapasztalatokat pedig a fentiek szerinti bináris klasszifikációs problémára jellemzően értékeljük. | |
650 | 4 | |a Természettudományok | |
650 | 4 | |a Számítás- és információtudomány | |
650 | 4 | |a Bölcsészettudományok | |
650 | 4 | |a Nyelvek és irodalom | |
695 | |a Nyelvészet - számítógép alkalmazása, Korpusz - nyelvészet | ||
710 | |a Magyar számítógépes nyelvészeti konferencia (18.) (2022) (Szeged) | ||
856 | 4 | 0 | |u http://acta.bibl.u-szeged.hu/75904/1/msznykonf_018_619-631.pdf |z Dokumentum-elérés |