Mély neuronhálós beszédfelismerők GMM-mentes tanítása
Az utóbbi pár évben a beszédfelismerőkben használt rejtett Markov modellekben (hidden Markov model, HMM) az ún. Gauss-keverékmodell (gaussian mixture model, GMM) komponenst leváltották a mély neuronhálók (deep neural network, DNN). Ugyanakkor ezek az új, neuronálókra épülő hibrid HMM/DNN felismerők...
Elmentve itt :
| Szerzők: | |
|---|---|
| Testületi szerző: | |
| Dokumentumtípus: | Könyv része |
| Megjelent: |
2017
|
| Sorozat: | Magyar Számítógépes Nyelvészeti Konferencia
13 |
| Kulcsszavak: | Nyelvészet - számítógép alkalmazása |
| Online Access: | http://acta.bibl.u-szeged.hu/59007 |
| LEADER | 02516naa a2200229 i 4500 | ||
|---|---|---|---|
| 001 | acta59007 | ||
| 005 | 20260224081030.0 | ||
| 008 | 190702s2017 hu o 100 hun d | ||
| 020 | |a 978-963-306-518-1 | ||
| 040 | |a SZTE Egyetemi Kiadványok Repozitórium |b hun | ||
| 041 | |a hun | ||
| 100 | 1 | |a Grósz Tamás | |
| 245 | 1 | 0 | |a Mély neuronhálós beszédfelismerők GMM-mentes tanítása |h [elektronikus dokumentum] / |c Grósz Tamás |
| 260 | |c 2017 | ||
| 300 | |a 170-180 | ||
| 490 | 0 | |a Magyar Számítógépes Nyelvészeti Konferencia |v 13 | |
| 520 | 3 | |a Az utóbbi pár évben a beszédfelismerőkben használt rejtett Markov modellekben (hidden Markov model, HMM) az ún. Gauss-keverékmodell (gaussian mixture model, GMM) komponenst leváltották a mély neuronhálók (deep neural network, DNN). Ugyanakkor ezek az új, neuronálókra épülő hibrid HMM/DNN felismerők számos olyan algoritmust megörököltek, melyeket eredetileg GMM-alapú rendszerekhez fejlesztettek ki, és így optimalitásuk az új környezetben nem garantált. A HMM/DNN modellek `GMM-mentes' tanításához két részfeladatra kell új megoldást adnunk. Az egyik, hogy a mély hálók időben illesztett tanító ímkéket igényelnek, a másik pedig a környezetfüggő állapotok előállítása, amelyre a klasszikus megoldás egy GMM-alapú klaszterezési algoritmus. Bár a HMM/DNN hibridek tanítására léteznek teljes mondatokon dolgozó ún. szekven ia-diszkriminatív tanítóalgoritmusok, ezeket jellemzően sak a tanítás legutolsó fázisában, a modellek �nomhangolására szokták bevetni, míg a tanítás elején HMM/GMM modellekel el®állított és illesztett ímkékből indulnak ki. Jelen ikkünkben viszont megmutatjuk, hogy megfelelő oda�gyeléssel a szekven iatanuló algoritmusok a tanítás legelejétől használhatóak. Az állapotklaszterezési lépésre korábban már javasoltunk egy GMM-mentes megoldást, így a ímkeillesztési feladat megoldásával egy teljesen GMM-mentes tanítási sémához jutottunk. Kísérleti eredményeink azt mutatják, hogy a javasolt megoldás nem sak gyorsabb, mint a hagyományos tanítási módszer, hanem valamivel jobb felismerési pontosságot is eredményez. | |
| 695 | |a Nyelvészet - számítógép alkalmazása | ||
| 700 | 0 | 1 | |a Gosztolya Gábor |e aut |
| 700 | 0 | 1 | |a Tóth László |e aut |
| 710 | |a Magyar Számítógépes Nyelvészeti Konferencia (13.) (2017) (Szeged) | ||
| 856 | 4 | 0 | |u http://acta.bibl.u-szeged.hu/59007/1/msznykonf_013_170-180.pdf |z Dokumentum-elérés |