Dokumentumcsoportok automatikus kulcsszavazása és témakövetés

A cikkben bemutatunk egy olyan algoritmust, mely a Látens Dirichlet Allokációt felhasználva, természetes nyelvű szöveghalmazt klaszterez, majd ezeket a csoportokat jól kifejező szavakkal felcímkézi. A kifejlesztett módszer alkalmas a dokumentumhalmaz időintervallumokra felosztott részein keletkezett...

Teljes leírás

Elmentve itt :
Bibliográfiai részletek
Szerzők: Ács Zsombor
Farkas Richárd
Testületi szerző: Magyar Számítógépes Nyelvészeti Konferencia (9.) (2013) (Szeged)
Dokumentumtípus: Könyv része
Megjelent: 2013
Sorozat:Magyar Számítógépes Nyelvészeti Konferencia 9
Kulcsszavak:Nyelvészet - számítógép alkalmazása
Online Access:http://acta.bibl.u-szeged.hu/58850
Leíró adatok
Tartalmi kivonat:A cikkben bemutatunk egy olyan algoritmust, mely a Látens Dirichlet Allokációt felhasználva, természetes nyelvű szöveghalmazt klaszterez, majd ezeket a csoportokat jól kifejező szavakkal felcímkézi. A kifejlesztett módszer alkalmas a dokumentumhalmaz időintervallumokra felosztott részein keletkezett klaszterhalmazok közötti összefüggések, átmenetek, illetve trendek feltárására. Kidolgoztunk egy olyan entrópiasúlyozáson alapuló címkézőt, mely empirikusan is jobb kulcsszavakkal látja el a klasztereket, mint a sztenderd módszerek (term-frekvencia, -négyzet statisztika).
Terjedelem/Fizikai jellemzők:289-296
ISBN:978-963-306-189-3