A HuTongue spontán beszélt nyelvi korpusz leiratozásának és annotálásának minőségbiztosítási munkálatai

Jelen dolgozatban egy magyar nyelvű, spontán beszélt nyelvi korpusz, a HuTongue leiratozásának és annotálásának minőségbiztosítási munkálatairól számolunk be. A korpuszban feldolgozott szövegeket hétköznapi szituációkban, külső ingerektől teljesen elzárt környezetben keletkezett spontán nyelvi produ...

Teljes leírás

Elmentve itt :
Bibliográfiai részletek
Szerzők: Gulyás Attila
Galántai Júlia
Szabó Martina Katalin
Szebeni Zea
Testületi szerző: Magyar Számítógépes Nyelvészeti Konferencia (14.) (2018) (Szeged)
Dokumentumtípus: Könyv része
Megjelent: 2018
Sorozat:Magyar Számítógépes Nyelvészeti Konferencia 14
Kulcsszavak:Nyelvészet - számítógép alkalmazása
Online Access:http://acta.bibl.u-szeged.hu/59055
LEADER 02631naa a2200241 i 4500
001 acta59055
005 20221108114925.0
008 190703s2018 hu o 1|| zxx d
020 |a 978-963-306-578-5 
040 |a SZTE Egyetemi Kiadványok Repozitórium  |b hun 
041 |a zxx 
100 1 |a Gulyás Attila 
245 1 2 |a A HuTongue spontán beszélt nyelvi korpusz leiratozásának és annotálásának minőségbiztosítási munkálatai  |h [elektronikus dokumentum] /  |c  Gulyás Attila 
260 |c 2018 
300 |a 317-330 
490 0 |a Magyar Számítógépes Nyelvészeti Konferencia  |v 14 
520 3 |a Jelen dolgozatban egy magyar nyelvű, spontán beszélt nyelvi korpusz, a HuTongue leiratozásának és annotálásának minőségbiztosítási munkálatairól számolunk be. A korpuszban feldolgozott szövegeket hétköznapi szituációkban, külső ingerektől teljesen elzárt környezetben keletkezett spontán nyelvi produktumok alkotják. A korpusz létrehozásának legfőbb célja, hogy megfelelő vizsgálati anyagot teremtsünk a pletyka természetének elsősorban társadalomtudományi szempontú kutatásához. A HuTongue egy egyedülálló adatbázis: tudomásunk szerint ez az egyetlen magyar nyelvű, nagy méretű, spontán szituációkban keletkezett, beszélt nyelvi korpusz, amely teljes egészében manuálisan gépelt és annotált formájú. A korpusz létrehozása – amely jelenleg is folyamatban van − több munkafázisban történik. Az előkészítés után a fájlokat egy feldolgozócsapat legépeli és annotáltatja. A munka három alapvető feladatból tevődik össze: a hanganyagon hallható verbális közlések rögzítéséből, a nem verbális hanghatások kódolásából, valamint egy, a kutatás szempontjából kardinális, szemantikai-−pragmatikai jellegű sajátság jelöléséből. Azt reméljük, hogy a korpusz a kutatási kérdés sokrétű és automatikus megoldásokkal hatékonyan támogatott vizsgálatát fogja lehetővé tenni a számunkra a jövőben. A jelen dolgozat célja, hogy bemutassuk e komplex feldolgozási munkának a minőségbiztosítási folyamatát. Szólunk a minőségbiztosítás szempontjairól, megtervezésének dilemmáiról és lépéseiről, valamint bemutatjuk az általunk alkalmazott megoldást. 
695 |a Nyelvészet - számítógép alkalmazása 
700 0 1 |a Galántai Júlia  |e aut 
700 0 1 |a Szabó Martina Katalin  |e aut 
700 0 1 |a Szebeni Zea  |e aut 
710 |a Magyar Számítógépes Nyelvészeti Konferencia (14.) (2018) (Szeged) 
856 4 0 |u http://acta.bibl.u-szeged.hu/59055/3/msznykonf_014_317-330.pdf  |z Dokumentum-elérés