Kézzel annotált magyar nyelvi korpusz a Szeged Korpusz /

Szeged Korpusz jelenlegi állapotában egy 1.2 millió szövegszóból álló szófajilag egyértelműsített, szintaktikai szempontból laposan elemzett adatbázis. Az elemzések szabályok alapján történő automatikus előelemzést követően kézi ellenőrzéssel és javítással történtek. A folyó munkálatok keretében egy...

Full description

Saved in:
Bibliographic Details
Main Authors: Csendes Dóra
Hatvani Csaba
Alexin Zoltán
Csirik János
Gyimóthy Tibor
Prószéky Gábor
Váradi Tamás
Corporate Author: Magyar Számítógépes Nyelvészeti Konferencia (1.) (2003) (Szeged)
Format: Book part
Published: 2003
Series:Magyar Számítógépes Nyelvészeti Konferencia 1
Kulcsszavak:Nyelvészet - számítógép alkalmazása
Online Access:http://acta.bibl.u-szeged.hu/59383
Description
Summary:Szeged Korpusz jelenlegi állapotában egy 1.2 millió szövegszóból álló szófajilag egyértelműsített, szintaktikai szempontból laposan elemzett adatbázis. Az elemzések szabályok alapján történő automatikus előelemzést követően kézi ellenőrzéssel és javítással történtek. A folyó munkálatok keretében egy bővebb szintaktikai elemzés, azaz egy magyar nyelvű treebank építése a cél, amelyben már szemantikai információk is szerepelni fognak. A korpusz regisztráció után hozzáférhető1, oktatási és kutatási célokra ingyenesen letölthető.
Physical Description:238-245