"A fatens felelt pedig..." - A Történeti Magánéleti Korpusz igei szerkezeteinek mozaik n-gram alapú feldolgozása

A jelen tanulmány bemutatja a mozaik n-gram módszer alkalmazásának első eredményeit a Történeti Magánéleti Korpusz nyelvi anyagán. Az esettanulmány célja a finit igét tartalmazó elemi mondatok mintázatainak feltérképezése és konstrukciójelöltjeinek kinyerése. A funkcionális konstrukciós nyelvtan mód...

Teljes leírás

Elmentve itt :
Bibliográfiai részletek
Szerzők: Bajzát Tímea Borbála
Indig Balázs
Kalivoda Ágnes
Testületi szerző: Magyar számítógépes nyelvészeti konferencia (20.)
Dokumentumtípus: Könyv része
Megjelent: Szegedi Tudományegyetem TTIK, Informatikai Intézet Szeged 2024
Sorozat:Magyar Számítógépes Nyelvészeti Konferencia 20
Kulcsszavak:Nyelvészet - számítógép alkalmazása
Tárgyszavak:
Online Access:http://acta.bibl.u-szeged.hu/88752
Leíró adatok
Tartalmi kivonat:A jelen tanulmány bemutatja a mozaik n-gram módszer alkalmazásának első eredményeit a Történeti Magánéleti Korpusz nyelvi anyagán. Az esettanulmány célja a finit igét tartalmazó elemi mondatok mintázatainak feltérképezése és konstrukciójelöltjeinek kinyerése. A funkcionális konstrukciós nyelvtan módszeréhez illeszkedő eljárás korábban alkalmazhatónak bizonyult infinitívuszos szerkezetek nyelvi mintázatainak azonosítására mai magyar nyelvi adatok elemzésénél. A konstrukciójelöltek félautomatikus módszerrel történő feltárása szükségszerű, mivel így kevésbé szükséges a nyelvész intuíciójára hagyatkozni. A mozaik n-gramok esetében a kinyert sorozatok elemei eltérő reprezentációs szinteken jelennek meg (szóalak, lemma, POS-tag), amely lehetővé teszi a nyelvi mintázatok eltérő absztrakciós szinteken történő azonosítását. Az eljárás diakrón korpuszokon történő alkalmazása segíti azt, hogy a konstrukciójelöltek feltárásán és egységes osztályozásán keresztül képesek legyünk hozzájárulni a magyar igei szerkezetek grammatikalizációs ösvényeinek adatalapú vizsgálatához. A tanulmány problémacentrikusan mutatja be az adaptációs folyamat kihívásaira (pl. annotációs séma egységesítése, elemi mondatok kinyerése) adott megoldásokat és a kapott eredményeket.
Terjedelem/Fizikai jellemzők:43-58
ISBN:978-963-306-973-8