Magyar ismeretlen szó-elemző program fejlesztése
Nagy korpuszok szám ítógépes feldolgozása során elkerülhetetlenül beleütközünk abba a problém ába, hogy a szövegekben szereplő szóalakok igen jelentős részét nem tu dja a rendelkezésre álló morfológiai elemzőprogram elemezni, mert hiányzik az adatbázisából a szó töve. Ugyanakkor ezeknek az elem ezhe...
Elmentve itt :
Szerzők: | |
---|---|
Testületi szerző: | |
Dokumentumtípus: | Könyv része |
Megjelent: |
2003
|
Sorozat: | Magyar Számítógépes Nyelvészeti Konferencia
1 |
Kulcsszavak: | Nyelvészet - számítógép alkalmazása |
Online Access: | http://acta.bibl.u-szeged.hu/59435 |
Tartalmi kivonat: | Nagy korpuszok szám ítógépes feldolgozása során elkerülhetetlenül beleütközünk abba a problém ába, hogy a szövegekben szereplő szóalakok igen jelentős részét nem tu dja a rendelkezésre álló morfológiai elemzőprogram elemezni, mert hiányzik az adatbázisából a szó töve. Ugyanakkor ezeknek az elem ezhetetlen szóalakoknak a nagy része tartalmaz toldalékokat, ezért valamilyen módon ezeket is elemezni kell. Ennek a problém ának a kezelésére olyan hibrid eljárást lehet alkalmazni, amely szimbolikus parciális morfológiai elemzőből és egy olyan statisztikai alapú eszközből áll, amely az első lépésben a szimbolikus ismeretlenszó-elemző által előállított hipotézisteret a kívánt mértékűre szűkíti. |
---|---|
Terjedelem/Fizikai jellemzők: | 45-54 |