Mély neuronhálós akusztikus modellek súlyinicializálásának vizsgálata

Az automatikus beszédfelismerés területén az akusztikus modellezésben gyakorlatilag egyeduralkodókká váltak a mély neurális hálók. Az irodalomban számos megoldást találunk arra, hogy hogyan érdemes beállítani a különböző paramétereket a DNN akusztikus modellek tanítása során, azonban általában kevés...

Teljes leírás

Elmentve itt :
Bibliográfiai részletek
Szerzők: Pintér Ádám
Tóth László
Gosztolya Gábor
Testületi szerző: Magyar Számítógépes Nyelvészeti Konferencia (16.) (2020) (Szeged)
Dokumentumtípus: Könyv része
Megjelent: 2020
Sorozat:Magyar Számítógépes Nyelvészeti Konferencia 16
Kulcsszavak:Beszédfelismerés - automatikus, Nyelvészet - számítógép alkalmazása
Online Access:http://acta.bibl.u-szeged.hu/67661
LEADER 01962naa a2200229 i 4500
001 acta67661
005 20260224081030.0
008 200505s2020 hu o 100 hun d
020 |a 978-963-306-719-2 
040 |a SZTE Egyetemi Kiadványok Repozitórium  |b hun 
041 |a hun 
100 1 |a Pintér Ádám 
245 1 0 |a Mély neuronhálós akusztikus modellek súlyinicializálásának vizsgálata  |h [elektronikus dokumentum] /  |c  Pintér Ádám 
260 |c 2020 
300 |a 313-321 
490 0 |a Magyar Számítógépes Nyelvészeti Konferencia  |v 16 
520 3 |a Az automatikus beszédfelismerés területén az akusztikus modellezésben gyakorlatilag egyeduralkodókká váltak a mély neurális hálók. Az irodalomban számos megoldást találunk arra, hogy hogyan érdemes beállítani a különböző paramétereket a DNN akusztikus modellek tanítása során, azonban általában kevés figyelmet szentelnek annak, hogy a hálók súlyait hogyan érdemes inicializálni. Eközben a gépi tanulási irodalomban ez egy igen aktív terület; a közelmúltban több stratégia is napvilágot látott a DNN kezdősúlyainak beállítására. Jelen munkánkban három ilyen eljárást tesztelünk mély neurális hálós akusztikus modellekben, három különböző aktivációs függvényt (szigmoid, ReLU és szoftplusz) használva. Eredményeink alapján mindenképp érdemes valamilyen speciális súlyinicializálási eljárást alkalmaznunk, ugyanakkor a három vizsgált stratégia (Glorot, He és Edge of Chaos) használatával elért fonémaszintű hibaarányok között nem találtunk szignifikáns különbséget. 
695 |a Beszédfelismerés - automatikus, Nyelvészet - számítógép alkalmazása 
700 0 1 |a Tóth László  |e aut 
700 0 1 |a Gosztolya Gábor  |e aut 
710 |a Magyar Számítógépes Nyelvészeti Konferencia (16.) (2020) (Szeged) 
856 4 0 |u http://acta.bibl.u-szeged.hu/67661/1/msznykonf_016_313-321.pdf  |z Dokumentum-elérés