Algorithms and Bounds for Sampling-based Approximate Policy Iteration
Paper i proceeding, 2008
Författare
Christos Dimitrakakis
Chalmers, Data- och informationsteknik, Datavetenskap
Michail Lagoudakis
EWRL 2008
Ämneskategorier
Data- och informationsvetenskap
Sannolikhetsteori och statistik