Statisztikai alapú tulajdonnév-felismerő magyar nyelvre

Ebben a cikkben bemutatunk egy döntési fa alapú statisztikai tulajdonnév-felismerő rendszert magyar nyelvre. A modellt a Szeged Korpusznak az MTI honlapjáról származó, gazdasági rövidhíreket tartalmazó szegmensén tanítottuk és teszteltük, s vizsgáltuk annak pontosságát különböző méretű és összetétel...

Teljes leírás

Elmentve itt :

Bibliográfiai részletek
Szerzők:	Farkas Richárd Szarvas György
Testületi szerző:	Magyar Számítógépes Nyelvészeti Konferencia (2.) (2004) (Szeged)
Dokumentumtípus:	Könyv része
Megjelent:	2004
Sorozat:	Magyar Számítógépes Nyelvészeti Konferencia 2
Kulcsszavak:	Nyelvészet - számítógép alkalmazása
Online Access:	http://acta.bibl.u-szeged.hu/59315

Leíró adatok
Tartalmi kivonat:	Ebben a cikkben bemutatunk egy döntési fa alapú statisztikai tulajdonnév-felismerő rendszert magyar nyelvre. A modellt a Szeged Korpusznak az MTI honlapjáról származó, gazdasági rövidhíreket tartalmazó szegmensén tanítottuk és teszteltük, s vizsgáltuk annak pontosságát különböző méretű és összetételű tanuló halmazok felhasználása esetén. A feladathoz csak numerikusán kódolható információkat használtunk fel (nem használtuk fel a szóalakot), melyek között előfordultak speciálisan a magyar nyelv tulajdonneveinek helyesírására vonatkozó előírásai is, de a feladat során célunk volt a gazdasági hírekben előforduló, nagy számú idegen eredetű tulajdonnév azonosítása is. A kísérletek során legjobb pontosságot mutató modell 89,6%-os F mértéket ért el.
Terjedelem/Fizikai jellemzők:	136-140

Statisztikai alapú tulajdonnév-felismerő magyar nyelvre

Hasonló tételek