A magyar beszélt és írott nyelv különböző korpuszainak morfológiai és szófaji vizsgálata

A tanulmányban egy nagyméretű, magyar, beszélt nyelvi adatbázist elemzünk, és annak morfológiai és szófaji sajátságait vetjük össze más írott nyelvi korpuszok sajátságaival. A HuTongue korpusz, amelyet manuálisan leiratoztattunk és annotáltattunk, elsősorban abból a célból készült, hogy egy alapvető...

Teljes leírás

Elmentve itt :

Bibliográfiai részletek
Szerzők:	Vincze Veronika Üveges István Szabó Martina Katalin Takács Károly
Testületi szerző:	Magyar számítógépes nyelvészeti konferencia (17.) (2021) (Szeged)
Dokumentumtípus:	Könyv része
Megjelent:	2021
Sorozat:	Magyar Számítógépes Nyelvészeti Konferencia 17
Kulcsszavak:	Nyelvészet - számítógép alkalmazása
Tárgyszavak:	Természettudományok Számítás- és információtudomány Bölcsészettudományok Nyelvek és irodalom
Online Access:	http://acta.bibl.u-szeged.hu/73366


LEADER	02527naa a2200289 i 4500
001	acta73366
005	20221108114913.0
008	210928s2021 hu o 1\|\| hun d
020			\|a 978-963-306-781-9
040			\|a SZTE Egyetemi Kiadványok Repozitórium \|b hun
041			\|a hun
100	1		\|a Vincze Veronika
245	1	2	\|a A magyar beszélt és írott nyelv különböző korpuszainak morfológiai és szófaji vizsgálata \|h [elektronikus dokumentum] / \|c Vincze Veronika
260			\|c 2021
300			\|a 169-182
490	0		\|a Magyar Számítógépes Nyelvészeti Konferencia \|v 17
520	3		\|a A tanulmányban egy nagyméretű, magyar, beszélt nyelvi adatbázist elemzünk, és annak morfológiai és szófaji sajátságait vetjük össze más írott nyelvi korpuszok sajátságaival. A HuTongue korpusz, amelyet manuálisan leiratoztattunk és annotáltattunk, elsősorban abból a célból készült, hogy egy alapvetően szociológusokból álló kutatócsoport a pletykadiskurzusok sajátosságait vizsgálhassa (Galántai és mtsai, 2018). A korpusz szövegei hétköznapi szituációkban, külső ingerektől elszigetelt környezetben keletkeztek (Gulyás és mtsai, 2018). Legjobb tudomásunk szerint a HuTongue az első olyan, nagyméretű, magyar beszélt nyelvi korpusz, amely szűretlenül tartalmazza az összes, az adott időszakban elhangzó rögzített beszélgetés részletesen annotált leiratát. Mivel az egyes beszélgetések esetenként több résztvevő oldalán is rögzítésre kerültek, így a duplikátumok kezelése a feldolgozás egy fontos, nem triviális lépése volt. A jelen részletesen tárgyalja e munkafázis megfontolásait és módszereit. Ezt követően bemutatja a létrejövő korpusz statisztikai, köztük morfológiai és szófaji alapadatait, összevetve néhány más írott korpusz alapvető adataival. Azt reméljük, hogy a korpuszunk hatékonyan támogatja majd számos különféle szociológiai és nyelvészeti probléma korpuszalapú kutatását a jövőben.
650		4	\|a Természettudományok
650		4	\|a Számítás- és információtudomány
650		4	\|a Bölcsészettudományok
650		4	\|a Nyelvek és irodalom
695			\|a Nyelvészet - számítógép alkalmazása
700	0	1	\|a Üveges István \|e aut
700	0	1	\|a Szabó Martina Katalin \|e aut
700	0	1	\|a Takács Károly \|e aut
710			\|a Magyar számítógépes nyelvészeti konferencia (17.) (2021) (Szeged)
856	4	0	\|u http://acta.bibl.u-szeged.hu/73366/1/msznykonf_017_169-182.pdf \|z Dokumentum-elérés

A magyar beszélt és írott nyelv különböző korpuszainak morfológiai és szófaji vizsgálata

Hasonló tételek