Mély neuronhálós beszédfelismerők GMM-mentes tanítása

Az utóbbi pár évben a beszédfelismerőkben használt rejtett Markov modellekben (hidden Markov model, HMM) az ún. Gauss-keverékmodell (gaussian mixture model, GMM) komponenst leváltották a mély neuronhálók (deep neural network, DNN). Ugyanakkor ezek az új, neuronálókra épülő hibrid HMM/DNN felismerők...

Teljes leírás

Elmentve itt :

Bibliográfiai részletek
Szerzők:	Grósz Tamás Gosztolya Gábor Tóth László
Testületi szerző:	Magyar Számítógépes Nyelvészeti Konferencia (13.) (2017) (Szeged)
Dokumentumtípus:	Könyv része
Megjelent:	2017
Sorozat:	Magyar Számítógépes Nyelvészeti Konferencia 13
Kulcsszavak:	Nyelvészet - számítógép alkalmazása
Online Access:	http://acta.bibl.u-szeged.hu/59007


LEADER	02516naa a2200229 i 4500
001	acta59007
005	20260224081030.0
008	190702s2017 hu o 100 hun d
020			\|a 978-963-306-518-1
040			\|a SZTE Egyetemi Kiadványok Repozitórium \|b hun
041			\|a hun
100	1		\|a Grósz Tamás
245	1	0	\|a Mély neuronhálós beszédfelismerők GMM-mentes tanítása \|h [elektronikus dokumentum] / \|c Grósz Tamás
260			\|c 2017
300			\|a 170-180
490	0		\|a Magyar Számítógépes Nyelvészeti Konferencia \|v 13
520	3		\|a Az utóbbi pár évben a beszédfelismerőkben használt rejtett Markov modellekben (hidden Markov model, HMM) az ún. Gauss-keverékmodell (gaussian mixture model, GMM) komponenst leváltották a mély neuronhálók (deep neural network, DNN). Ugyanakkor ezek az új, neuronálókra épülő hibrid HMM/DNN felismerők számos olyan algoritmust megörököltek, melyeket eredetileg GMM-alapú rendszerekhez fejlesztettek ki, és így optimalitásuk az új környezetben nem garantált. A HMM/DNN modellek `GMM-mentes' tanításához két részfeladatra kell új megoldást adnunk. Az egyik, hogy a mély hálók időben illesztett tanító ímkéket igényelnek, a másik pedig a környezetfüggő állapotok előállítása, amelyre a klasszikus megoldás egy GMM-alapú klaszterezési algoritmus. Bár a HMM/DNN hibridek tanítására léteznek teljes mondatokon dolgozó ún. szekven ia-diszkriminatív tanítóalgoritmusok, ezeket jellemzően sak a tanítás legutolsó fázisában, a modellek �nomhangolására szokták bevetni, míg a tanítás elején HMM/GMM modellekel el®állított és illesztett ímkékből indulnak ki. Jelen ikkünkben viszont megmutatjuk, hogy megfelelő oda�gyeléssel a szekven iatanuló algoritmusok a tanítás legelejétől használhatóak. Az állapotklaszterezési lépésre korábban már javasoltunk egy GMM-mentes megoldást, így a ímkeillesztési feladat megoldásával egy teljesen GMM-mentes tanítási sémához jutottunk. Kísérleti eredményeink azt mutatják, hogy a javasolt megoldás nem sak gyorsabb, mint a hagyományos tanítási módszer, hanem valamivel jobb felismerési pontosságot is eredményez.
695			\|a Nyelvészet - számítógép alkalmazása
700	0	1	\|a Gosztolya Gábor \|e aut
700	0	1	\|a Tóth László \|e aut
710			\|a Magyar Számítógépes Nyelvészeti Konferencia (13.) (2017) (Szeged)
856	4	0	\|u http://acta.bibl.u-szeged.hu/59007/1/msznykonf_013_170-180.pdf \|z Dokumentum-elérés

Mély neuronhálós beszédfelismerők GMM-mentes tanítása

Hasonló tételek