A HuTongue spontán beszélt nyelvi korpusz leiratozásának és annotálásának minőségbiztosítási munkálatai
Jelen dolgozatban egy magyar nyelvű, spontán beszélt nyelvi korpusz, a HuTongue leiratozásának és annotálásának minőségbiztosítási munkálatairól számolunk be. A korpuszban feldolgozott szövegeket hétköznapi szituációkban, külső ingerektől teljesen elzárt környezetben keletkezett spontán nyelvi produ...
Elmentve itt :
Szerzők: | |
---|---|
Testületi szerző: | |
Dokumentumtípus: | Könyv része |
Megjelent: |
2018
|
Sorozat: | Magyar Számítógépes Nyelvészeti Konferencia
14 |
Kulcsszavak: | Nyelvészet - számítógép alkalmazása |
Online Access: | http://acta.bibl.u-szeged.hu/59055 |
LEADER | 02631naa a2200241 i 4500 | ||
---|---|---|---|
001 | acta59055 | ||
005 | 20221108114925.0 | ||
008 | 190703s2018 hu o 1|| zxx d | ||
020 | |a 978-963-306-578-5 | ||
040 | |a SZTE Egyetemi Kiadványok Repozitórium |b hun | ||
041 | |a zxx | ||
100 | 1 | |a Gulyás Attila | |
245 | 1 | 2 | |a A HuTongue spontán beszélt nyelvi korpusz leiratozásának és annotálásának minőségbiztosítási munkálatai |h [elektronikus dokumentum] / |c Gulyás Attila |
260 | |c 2018 | ||
300 | |a 317-330 | ||
490 | 0 | |a Magyar Számítógépes Nyelvészeti Konferencia |v 14 | |
520 | 3 | |a Jelen dolgozatban egy magyar nyelvű, spontán beszélt nyelvi korpusz, a HuTongue leiratozásának és annotálásának minőségbiztosítási munkálatairól számolunk be. A korpuszban feldolgozott szövegeket hétköznapi szituációkban, külső ingerektől teljesen elzárt környezetben keletkezett spontán nyelvi produktumok alkotják. A korpusz létrehozásának legfőbb célja, hogy megfelelő vizsgálati anyagot teremtsünk a pletyka természetének elsősorban társadalomtudományi szempontú kutatásához. A HuTongue egy egyedülálló adatbázis: tudomásunk szerint ez az egyetlen magyar nyelvű, nagy méretű, spontán szituációkban keletkezett, beszélt nyelvi korpusz, amely teljes egészében manuálisan gépelt és annotált formájú. A korpusz létrehozása – amely jelenleg is folyamatban van − több munkafázisban történik. Az előkészítés után a fájlokat egy feldolgozócsapat legépeli és annotáltatja. A munka három alapvető feladatból tevődik össze: a hanganyagon hallható verbális közlések rögzítéséből, a nem verbális hanghatások kódolásából, valamint egy, a kutatás szempontjából kardinális, szemantikai-−pragmatikai jellegű sajátság jelöléséből. Azt reméljük, hogy a korpusz a kutatási kérdés sokrétű és automatikus megoldásokkal hatékonyan támogatott vizsgálatát fogja lehetővé tenni a számunkra a jövőben. A jelen dolgozat célja, hogy bemutassuk e komplex feldolgozási munkának a minőségbiztosítási folyamatát. Szólunk a minőségbiztosítás szempontjairól, megtervezésének dilemmáiról és lépéseiről, valamint bemutatjuk az általunk alkalmazott megoldást. | |
695 | |a Nyelvészet - számítógép alkalmazása | ||
700 | 0 | 1 | |a Galántai Júlia |e aut |
700 | 0 | 1 | |a Szabó Martina Katalin |e aut |
700 | 0 | 1 | |a Szebeni Zea |e aut |
710 | |a Magyar Számítógépes Nyelvészeti Konferencia (14.) (2018) (Szeged) | ||
856 | 4 | 0 | |u http://acta.bibl.u-szeged.hu/59055/3/msznykonf_014_317-330.pdf |z Dokumentum-elérés |