Új korpuszstatisztikai eszköztár kollokációkeresésre

A nyelvi erőforrások - korpuszok, lexikonok - előkészítése a számítógépes nyelvészet leginkább munkaigényes művelete, szakmai konferenciákon mégis viszonylag kevés előadás foglalkozik vele - talán mert tudományos szempontból itt lehet felmutatni a legkevesebb új eredményt. Ez az előadás is leginkább...

Full description

Saved in:
Bibliographic Details
Main Authors: Kis Balázs
Ugray Gábor
Corporate Author: Magyar Számítógépes Nyelvészeti Konferencia (1.) (2003) (Szeged)
Format: Book part
Published: 2003
Series:Magyar Számítógépes Nyelvészeti Konferencia 1
Kulcsszavak:Nyelvészet - számítógép alkalmazása
Online Access:http://acta.bibl.u-szeged.hu/59411
Description
Summary:A nyelvi erőforrások - korpuszok, lexikonok - előkészítése a számítógépes nyelvészet leginkább munkaigényes művelete, szakmai konferenciákon mégis viszonylag kevés előadás foglalkozik vele - talán mert tudományos szempontból itt lehet felmutatni a legkevesebb új eredményt. Ez az előadás is leginkább azt hangsúlyozza, hogyan lehet meglevő nyelvtechnológiai és egyéb számítógépes eszközök felhasználásával hatékonyabbá tenni a korpuszok előkészítését és feldolgozását. Az előadás olyan új korpuszelőkészítő és -statisztikai eszköztárt mutat be, amely általánosan használható kollokációkeresésre egynyelvű korpuszokban, és annotálatlan korpuszból kiindulva is ad értékes eredményt. Az eszköztár a teljes műveletsort felöleli, a korpusz előkészítésétől a statisztikai számítások ldértékelésééig.
Physical Description:131-136