Factored temporal difference learning in the new ties environment
Although reinforcement learning is a popular method for training an agent for decision making based on rewards, well studied tabular methods are not applicable for large, realistic problems. In this paper, we experiment with a factored version of temporal difference learning, which boils down to a l...
Elmentve itt :
Szerzők: |
Gyenes Viktor Bontovics Ákos Lőrincz András |
---|---|
Testületi szerző: | Symposium of Young Scientists on Intelligent Systems (2.) (2007) (Budapest) |
Dokumentumtípus: | Cikk |
Megjelent: |
2008
|
Sorozat: | Acta cybernetica
18 No. 4 |
Kulcsszavak: | Számítástechnika, Kibernetika |
Tárgyszavak: | |
Online Access: | http://acta.bibl.u-szeged.hu/12840 |
Hasonló tételek
-
Learning in a virtual environment
Szerző: Hampel György
Megjelent: (2014) -
Creating a Virtual Learning Environment
Szerző: Hampel György, et al.
Megjelent: (2014) -
Gossip-Based Machine Learning in Fully Distributed Environments
Szerző: Hegedűs István
Megjelent: (2017) -
Factored value iteration converges
Szerző: Szita István, et al.
Megjelent: (2008) -
A new concept of effective regression test generation in a C++ specific environment
Szerző: Biczó Mihály, et al.
Megjelent: (2008)