Magyarcentrikus többnyelvű gépifordító rendszerek létrehozása

Kutatásunkban magyarcentrikus többnyelvű gépifordító rendszereket hoztunk létre. Egy konkrét projekt folytatásaként terjesztettük ki a kétnyelvű kísérleteinket többnyelvű modellekre. A projekt célja az volt, hogy 12 különböző nyelvről lehessen magyarra fordítani lehetőleg egy neurális modell alkalma...

Teljes leírás

Elmentve itt :
Bibliográfiai részletek
Szerzők: Laki László János
Yang Zijian Győző
Testületi szerző: Magyar számítógépes nyelvészeti konferencia (19.)
Dokumentumtípus: Könyv része
Megjelent: 2023
Sorozat:Magyar Számítógépes Nyelvészeti Konferencia 19
Kulcsszavak:Nyelvészet - számítógép alkalmazása
Tárgyszavak:
Online Access:http://acta.bibl.u-szeged.hu/78426
LEADER 02007naa a2200241 i 4500
001 acta78426
005 20230316105258.0
008 230316s2023 hu o 1|| hun d
020 |a 978-963-306-912-7 
040 |a SZTE Egyetemi Kiadványok Repozitórium  |b hun 
041 |a hun 
100 1 |a Laki László János 
245 1 0 |a Magyarcentrikus többnyelvű gépifordító rendszerek létrehozása  |h [elektronikus dokumentum] /  |c  Laki László János 
260 |c 2023 
300 |a 369-380 
490 0 |a Magyar Számítógépes Nyelvészeti Konferencia  |v 19 
520 3 |a Kutatásunkban magyarcentrikus többnyelvű gépifordító rendszereket hoztunk létre. Egy konkrét projekt folytatásaként terjesztettük ki a kétnyelvű kísérleteinket többnyelvű modellekre. A projekt célja az volt, hogy 12 különböző nyelvről lehessen magyarra fordítani lehetőleg egy neurális modell alkalmazásával. Kutatásunk során betanítottunk egy előtudás nélküli Marian NMT gépifordító rendszert, valamint sikerült finomhangolnunk az M2M100 és az NLLB-200 többnyelvű előtanított modelleket. Az általunk létrehozott modelleket végül egymással, valamint különböző ipari rendszerekkel hasonlítottuk össze. A saját teszt korpuszunkon az M2M100 finomhangolt modell érte el a legjobb eredményt. A előtanított modelljeinket nyelvenként csupán 3 millió szegmenspárral és 1 epoch értékkel hangoltuk, további tanítóadat vagy tanítási lépés hozzáadásával tovább növelhető a minőségük. Kutatásunkban bemutattuk, hogy az angolcentrikus többnyelvű modellek áthangolhatóak magyarcentrikusra. 
650 4 |a Természettudományok 
650 4 |a Számítás- és információtudomány 
695 |a Nyelvészet - számítógép alkalmazása 
700 0 2 |a Yang Zijian Győző  |e aut 
711 |a Magyar számítógépes nyelvészeti konferencia (19.)  |c Szeged  |d 2023. január 26-27. 
856 4 0 |u http://acta.bibl.u-szeged.hu/78426/1/msznykonf_019_369-380..pdf  |z Dokumentum-elérés