Statistical named entity recognition for Hungarian

In this paper, we present decision tree based statistical Named Entity recognizer system for Hungarian. The model was trained and tested on a segment of the Szeged Corpus, containing short business news articles, collected from MTI (Hungarian News Agency, www.mti.hul. We applied C4.5 for classificat...

Teljes leírás

Elmentve itt :
Bibliográfiai részletek
Szerzők: Farkas Richárd
Szarvas György
Testületi szerző: Magyar Számítógépes Nyelvészeti Konferencia (2.) (2004) (Szeged)
Dokumentumtípus: Könyv része
Megjelent: 2004
Sorozat:Magyar Számítógépes Nyelvészeti Konferencia 2
Kulcsszavak:Nyelvészet - számítógép alkalmazása - előadáskivonat
Online Access:http://acta.bibl.u-szeged.hu/59278
LEADER 01519naa a2200205 i 4500
001 acta59278
005 20221108115106.0
008 190716s2004 hu o 1|| zxx d
040 |a SZTE Egyetemi Kiadványok Repozitórium  |b hun 
041 |a zxx 
100 1 |a Farkas Richárd 
245 1 0 |a Statistical named entity recognition for Hungarian  |h [elektronikus dokumentum] /  |c  Farkas Richárd 
260 |c 2004 
300 |a 346 
490 0 |a Magyar Számítógépes Nyelvészeti Konferencia  |v 2 
520 3 |a In this paper, we present decision tree based statistical Named Entity recognizer system for Hungarian. The model was trained and tested on a segment of the Szeged Corpus, containing short business news articles, collected from MTI (Hungarian News Agency, www.mti.hul. We applied C4.5 for classificaton, and examined the accuracy of the system using training sets of different sizes. For this task we used only numerically encodable information (we excluded the word form itself), which contained some orthographical rules specific to Hungarian, but we trained for the recognition of foreign language proper nouns appearing frequently in business news as well. During the experiments the best results showed an accuracy of 89.6% F measure. 
695 |a Nyelvészet - számítógép alkalmazása - előadáskivonat 
700 0 1 |a Szarvas György  |e aut 
710 |a Magyar Számítógépes Nyelvészeti Konferencia (2.) (2004) (Szeged) 
856 4 0 |u http://acta.bibl.u-szeged.hu/59278/1/msznykonf_002_346.pdf  |z Dokumentum-elérés