Constrained Policy Gradient Method for Safe and Fast Reinforcement Learning: a Neural Tangent Kernel Based Approach
Preprint, 2021
RL
Neural Tangent Kernel
ML
Författare
Balázs Varga
Chalmers, Elektroteknik, System- och reglerteknik
Balázs Adam Kulcsár
Chalmers, Elektroteknik, System- och reglerteknik
Morteza Haghir Chehreghani
Chalmers, Data- och informationsteknik, Data Science
Real-Time Robust and AdaptIve Learning in ElecTric VEhicles (RITE)
Chalmers, 2020-01-01 -- 2021-12-31.
Chalmers AI-forskningscentrum (CHAIR), 2020-01-01 -- 2021-12-31.
Styrkeområden
Informations- och kommunikationsteknik
Transport
Ämneskategorier
Lärande
Systemvetenskap
Datavetenskap (datalogi)
Relaterade dataset
URI: https://arxiv.org/abs/2107.09139