Modular reinforcement learning a case study in a robot domain /

The behaviour of reinforcement learning (RL) algorithms is best understood in completely observable, finite state- and action-space, discrete-time controlled Markov-chains. Robot-learning domains, on the other hand, are inherently infinite both in time and space, and moreover they are only partially...

Teljes leírás

Elmentve itt :
Bibliográfiai részletek
Szerzők: Kalmár Zsolt
Szepesvári Csaba
Lőrincz András
Dokumentumtípus: Cikk
Megjelent: 2000
Sorozat:Acta cybernetica 14 No. 3
Kulcsszavak:Számítástechnika, Kibernetika
Tárgyszavak:
Online Access:http://acta.bibl.u-szeged.hu/12645

Hasonló tételek