Nem felügyelt módszerek alkalmazása releváns kifejezések azonosítására és csoportosítására klinikai dokumentumokban
A kórházi körülmények között létrejövő klinikai dokumentumok feldolgozása a nyelvtechnológia egyik központi kutatási területévé vált az utóbbi időben. A más jellegű, általános nyelvezetű szövegek feldolgozására használt kész eszközök azonban nem alkalmazhatóak, illetve gyengén teljesítenek a speciál...
Elmentve itt :
Szerzők: | |
---|---|
Testületi szerző: | |
Dokumentumtípus: | Könyv része |
Megjelent: |
2015
|
Sorozat: | Magyar Számítógépes Nyelvészeti Konferencia
11 |
Kulcsszavak: | Nyelvészet - számítógép alkalmazása |
Online Access: | http://acta.bibl.u-szeged.hu/58937 |
LEADER | 02429naa a2200217 i 4500 | ||
---|---|---|---|
001 | acta58937 | ||
005 | 20221108114942.0 | ||
008 | 190628s2015 hu o 1|| zxx d | ||
020 | |a 978-963-306-359-0 | ||
040 | |a SZTE Egyetemi Kiadványok Repozitórium |b hun | ||
041 | |a zxx | ||
100 | 1 | |a Siklósi Borbála | |
245 | 1 | 4 | |a Nem felügyelt módszerek alkalmazása releváns kifejezések azonosítására és csoportosítására klinikai dokumentumokban |h [elektronikus dokumentum] / |c Siklósi Borbála |
260 | |c 2015 | ||
300 | |a 237-248 | ||
490 | 0 | |a Magyar Számítógépes Nyelvészeti Konferencia |v 11 | |
520 | 3 | |a A kórházi körülmények között létrejövő klinikai dokumentumok feldolgozása a nyelvtechnológia egyik központi kutatási területévé vált az utóbbi időben. A más jellegű, általános nyelvezetű szövegek feldolgozására használt kész eszközök azonban nem alkalmazhatóak, illetve gyengén teljesítenek a speciális orvosi szövegek esetén. Továbbá számos olyan feladat van, amelyek során a szakkifejezések azonosítása és a közöttük lévő kapcsolatok meghatározása nagyon fontos lépés, azonban csak külső lexikai erőforrások, tezauruszok és ontológiák segítségével oldhatók meg. Az olyan kisebb nyelvek esetén, mint a magyar, ilyen tudásbázisok nem állnak rendelkezésre. Ezért a szövegekben lévő információk annotálása és rendszerezése emberi szakértői munkát igényel. Ebben a cikkben bemutatjuk, hogy statisztikai módszerekkel milyen módon alakíthatók át a nyers dokumentumok egy olyan előfeldolgozott, részben strukturált formára, ami ezt az emberi munkát könnyebbé teszi. A csupán a korpusz felhasználásával alkalmazott modulok felismerik és feloldják a rövidítéseket, azonosítják a többszavas kifejezéseket és meghatározzák azok hasonlóságát. Végül létrehoztuk a szövegek egy magasabb szintű reprezentációját, ahol az egyes kifejezések helyére a hasonlóságuk alapján kialakított klaszterek azonosítóját helyettesítve a szövegek egyszerűsíthetőek, a gyakran ismétlődő mintázatok általános alakja meghatározható. | |
695 | |a Nyelvészet - számítógép alkalmazása | ||
700 | 0 | 1 | |a Novák Attila |e aut |
710 | |a Magyar Számítógépes Nyelvészeti Konferencia (11.) (2015) (Szeged) | ||
856 | 4 | 0 | |u http://acta.bibl.u-szeged.hu/58937/1/msznykonf_011_237-248.pdf |z Dokumentum-elérés |