Probabilistic inverse reinforcement learning in unknown environments

Aristide Tossou; Christos Dimitrakakis

Probabilistic inverse reinforcement learning in unknown environments
Paper i proceeding, 2013

We consider the problem of learning by demonstration from agents acting in un- known stochastic Markov environments or games. Our aim is to estimate agent prefer- ences in order to construct improved policies for the same task that the agents are trying to solve. To do so, we extend previous prob- abilistic approaches for inverse reinforcement learning in known MDPs to the case of un- known dynamics or opponents. We do this by deriving two simplified probabilistic mod- els of the demonstrator's policy and utility. For tractability, we use maximum a posteri- ori estimation rather than full Bayesian in- ference. Under a at prior, this results in a convex optimisation problem. We nd that the resulting algorithms are highly compet- itive against a variety of other methods for inverse reinforcement learning that do have knowledge of the dynamics.

Författare

Aristide Tossou

Forskning Andra publikationer

Christos Dimitrakakis

Chalmers, Data- och informationsteknik, Datavetenskap

Forskning Andra publikationer

Conference on Uncertainty in Artificial Intelligence, UAI 2013

Styrkeområden

Informations- och kommunikationsteknik

Ämneskategorier (SSIF 2011)

Människa-datorinteraktion (interaktionsdesign)

Sannolikhetsteori och statistik

Mer information

Skapat

2017-10-08

Om du har frågor, behöver hjälp, hittar en bugg eller vill ge feedback kan du göra det här nedan. Du når oss också direkt per e-post research.lib@chalmers.se.

Meddelande

Din e-postadress

Research.chalmers.se innehåller information om forskning på Chalmers, publikationer och projekt inklusive information om finansiärer och samarbetspartners.

Läs mer om tjänsten, täckningsgrad och vilka som kan se informationen

Personuppgifter och cookies

Tillgänglighet

Citation Style Language
citeproc-js (Frank Bennett)

Chalmers bibliotek

Chalmers forskning

Chalmers examensarbeten

412 96 GÖTEBORG
TELEFON: 031-772 10 00
WWW.CHALMERS.SE