Nem felügyelt módszerek alkalmazása releváns kifejezések azonosítására és csoportosítására klinikai dokumentumokban

A kórházi körülmények között létrejövő klinikai dokumentumok feldolgozása a nyelvtechnológia egyik központi kutatási területévé vált az utóbbi időben. A más jellegű, általános nyelvezetű szövegek feldolgozására használt kész eszközök azonban nem alkalmazhatóak, illetve gyengén teljesítenek a speciál...

Teljes leírás

Elmentve itt :
Bibliográfiai részletek
Szerzők: Siklósi Borbála
Novák Attila
Testületi szerző: Magyar Számítógépes Nyelvészeti Konferencia (11.) (2015) (Szeged)
Dokumentumtípus: Könyv része
Megjelent: 2015
Sorozat:Magyar Számítógépes Nyelvészeti Konferencia 11
Kulcsszavak:Nyelvészet - számítógép alkalmazása
Online Access:http://acta.bibl.u-szeged.hu/58937
LEADER 02429naa a2200217 i 4500
001 acta58937
005 20221108114942.0
008 190628s2015 hu o 1|| zxx d
020 |a 978-963-306-359-0 
040 |a SZTE Egyetemi Kiadványok Repozitórium  |b hun 
041 |a zxx 
100 1 |a Siklósi Borbála 
245 1 4 |a Nem felügyelt módszerek alkalmazása releváns kifejezések azonosítására és csoportosítására klinikai dokumentumokban  |h [elektronikus dokumentum] /  |c  Siklósi Borbála 
260 |c 2015 
300 |a 237-248 
490 0 |a Magyar Számítógépes Nyelvészeti Konferencia  |v 11 
520 3 |a A kórházi körülmények között létrejövő klinikai dokumentumok feldolgozása a nyelvtechnológia egyik központi kutatási területévé vált az utóbbi időben. A más jellegű, általános nyelvezetű szövegek feldolgozására használt kész eszközök azonban nem alkalmazhatóak, illetve gyengén teljesítenek a speciális orvosi szövegek esetén. Továbbá számos olyan feladat van, amelyek során a szakkifejezések azonosítása és a közöttük lévő kapcsolatok meghatározása nagyon fontos lépés, azonban csak külső lexikai erőforrások, tezauruszok és ontológiák segítségével oldhatók meg. Az olyan kisebb nyelvek esetén, mint a magyar, ilyen tudásbázisok nem állnak rendelkezésre. Ezért a szövegekben lévő információk annotálása és rendszerezése emberi szakértői munkát igényel. Ebben a cikkben bemutatjuk, hogy statisztikai módszerekkel milyen módon alakíthatók át a nyers dokumentumok egy olyan előfeldolgozott, részben strukturált formára, ami ezt az emberi munkát könnyebbé teszi. A csupán a korpusz felhasználásával alkalmazott modulok felismerik és feloldják a rövidítéseket, azonosítják a többszavas kifejezéseket és meghatározzák azok hasonlóságát. Végül létrehoztuk a szövegek egy magasabb szintű reprezentációját, ahol az egyes kifejezések helyére a hasonlóságuk alapján kialakított klaszterek azonosítóját helyettesítve a szövegek egyszerűsíthetőek, a gyakran ismétlődő mintázatok általános alakja meghatározható. 
695 |a Nyelvészet - számítógép alkalmazása 
700 0 1 |a Novák Attila  |e aut 
710 |a Magyar Számítógépes Nyelvészeti Konferencia (11.) (2015) (Szeged) 
856 4 0 |u http://acta.bibl.u-szeged.hu/58937/1/msznykonf_011_237-248.pdf  |z Dokumentum-elérés