Környezetfüggő akusztikai modellek létrehozása Kullback-Leibler-divergencia alapú klaszterezéssel
Az elmúlt néhány év során a beszédfelismerésben a rejtett Markov modellek Gauss keverékmodelljeit (Gaussian Mixture Models, GMM) háttérbe szorították a mély neuronhálók (Deep Neural Networks, DNN). Ugyanakkor a neuronhálókra épülő felismerők számos olyan tanítási algoritmust megörököltek (változatla...
Elmentve itt :
Szerzők: | |
---|---|
Testületi szerző: | |
Dokumentumtípus: | Könyv része |
Megjelent: |
2015
|
Sorozat: | Magyar Számítógépes Nyelvészeti Konferencia
11 |
Kulcsszavak: | Nyelvészet - számítógép alkalmazása |
Online Access: | http://acta.bibl.u-szeged.hu/58930 |
LEADER | 02263naa a2200229 i 4500 | ||
---|---|---|---|
001 | acta58930 | ||
005 | 20221108114938.0 | ||
008 | 190628s2015 hu o 1|| zxx d | ||
020 | |a 978-963-306-359-0 | ||
040 | |a SZTE Egyetemi Kiadványok Repozitórium |b hun | ||
041 | |a zxx | ||
100 | 1 | |a Grósz Tamás | |
245 | 1 | 0 | |a Környezetfüggő akusztikai modellek létrehozása Kullback-Leibler-divergencia alapú klaszterezéssel |h [elektronikus dokumentum] / |c Grósz Tamás |
260 | |c 2015 | ||
300 | |a 174-181 | ||
490 | 0 | |a Magyar Számítógépes Nyelvészeti Konferencia |v 11 | |
520 | 3 | |a Az elmúlt néhány év során a beszédfelismerésben a rejtett Markov modellek Gauss keverékmodelljeit (Gaussian Mixture Models, GMM) háttérbe szorították a mély neuronhálók (Deep Neural Networks, DNN). Ugyanakkor a neuronhálókra épülő felismerők számos olyan tanítási algoritmust megörököltek (változatlan formában vagy apróbb változtatásokkal), melyeket eredetileg HMM/GMM rendszerekhez fejlesztettek ki; ezek optimalitása az új környezetben egyáltalán nem garantált. Ilyen tanítási lépés a környezetfüggő fonémaállapot-halmaz meghatározása is, amire az általánosan elfogadott megoldás egy döntésifa-alapú algoritmus. Ez az eljárás arra törekszik, hogy az előálló állapotokhoz tartozó példák Gauss-görbékkel optimálisan modellezhetőek legyenek. Jelen cikkünkben egy alternatív eljárást vizsgálunk meg, mely a döntési fát egy KullbackLeibler–divergencia alapú döntési kritériumra támaszkodva építi fel. Feltételezésünk szerint ez a kritérium alkalmasabb a neuronháló kimeneteinek leírására, mint a gaussos modellezés. A módszert korábban már sikeresen alkalmazták egy KL-HMM rendszerben, most pedig megmutatjuk, hogy egy HMM/DNN hibrid rendszerben is működőképes. Alkalmazásával 4%-os relatív hibacsökkenést értünk el egy nagyszótáras szófelismerési feladaton. | |
695 | |a Nyelvészet - számítógép alkalmazása | ||
700 | 0 | 1 | |a Gosztolya Gábor |e aut |
700 | 0 | 1 | |a Tóth László |e aut |
710 | |a Magyar Számítógépes Nyelvészeti Konferencia (11.) (2015) (Szeged) | ||
856 | 4 | 0 | |u http://acta.bibl.u-szeged.hu/58930/1/msznykonf_011_174-181.pdf |z Dokumentum-elérés |