Nem felügyelt módszerek alkalmazása releváns kifejezések azonosítására és csoportosítására klinikai dokumentumokban

A kórházi körülmények között létrejövő klinikai dokumentumok feldolgozása a nyelvtechnológia egyik központi kutatási területévé vált az utóbbi időben. A más jellegű, általános nyelvezetű szövegek feldolgozására használt kész eszközök azonban nem alkalmazhatóak, illetve gyengén teljesítenek a speciál...

Teljes leírás

Elmentve itt :

Bibliográfiai részletek
Szerzők:	Siklósi Borbála Novák Attila
Testületi szerző:	Magyar Számítógépes Nyelvészeti Konferencia (11.) (2015) (Szeged)
Dokumentumtípus:	Könyv része
Megjelent:	2015
Sorozat:	Magyar Számítógépes Nyelvészeti Konferencia 11
Kulcsszavak:	Nyelvészet - számítógép alkalmazása
Online Access:	http://acta.bibl.u-szeged.hu/58937


LEADER	02429naa a2200217 i 4500
001	acta58937
005	20221108114942.0
008	190628s2015 hu o 1\|\| zxx d
020			\|a 978-963-306-359-0
040			\|a SZTE Egyetemi Kiadványok Repozitórium \|b hun
041			\|a zxx
100	1		\|a Siklósi Borbála
245	1	4	\|a Nem felügyelt módszerek alkalmazása releváns kifejezések azonosítására és csoportosítására klinikai dokumentumokban \|h [elektronikus dokumentum] / \|c Siklósi Borbála
260			\|c 2015
300			\|a 237-248
490	0		\|a Magyar Számítógépes Nyelvészeti Konferencia \|v 11
520	3		\|a A kórházi körülmények között létrejövő klinikai dokumentumok feldolgozása a nyelvtechnológia egyik központi kutatási területévé vált az utóbbi időben. A más jellegű, általános nyelvezetű szövegek feldolgozására használt kész eszközök azonban nem alkalmazhatóak, illetve gyengén teljesítenek a speciális orvosi szövegek esetén. Továbbá számos olyan feladat van, amelyek során a szakkifejezések azonosítása és a közöttük lévő kapcsolatok meghatározása nagyon fontos lépés, azonban csak külső lexikai erőforrások, tezauruszok és ontológiák segítségével oldhatók meg. Az olyan kisebb nyelvek esetén, mint a magyar, ilyen tudásbázisok nem állnak rendelkezésre. Ezért a szövegekben lévő információk annotálása és rendszerezése emberi szakértői munkát igényel. Ebben a cikkben bemutatjuk, hogy statisztikai módszerekkel milyen módon alakíthatók át a nyers dokumentumok egy olyan előfeldolgozott, részben strukturált formára, ami ezt az emberi munkát könnyebbé teszi. A csupán a korpusz felhasználásával alkalmazott modulok felismerik és feloldják a rövidítéseket, azonosítják a többszavas kifejezéseket és meghatározzák azok hasonlóságát. Végül létrehoztuk a szövegek egy magasabb szintű reprezentációját, ahol az egyes kifejezések helyére a hasonlóságuk alapján kialakított klaszterek azonosítóját helyettesítve a szövegek egyszerűsíthetőek, a gyakran ismétlődő mintázatok általános alakja meghatározható.
695			\|a Nyelvészet - számítógép alkalmazása
700	0	1	\|a Novák Attila \|e aut
710			\|a Magyar Számítógépes Nyelvészeti Konferencia (11.) (2015) (Szeged)
856	4	0	\|u http://acta.bibl.u-szeged.hu/58937/1/msznykonf_011_237-248.pdf \|z Dokumentum-elérés

Nem felügyelt módszerek alkalmazása releváns kifejezések azonosítására és csoportosítására klinikai dokumentumokban

Hasonló tételek