Rewarding Change beyond State: Directional VLM Rewards for Sample-Efficient Robot Reinforcement Learning *
Paper i proceeding, 2026
Författare
Linus Lundgren
Student vid Chalmers
Wenhao Lu
Chalmers, Elektroteknik, System- och reglerteknik
Zhitao Liang
Chalmers, Elektroteknik, System- och reglerteknik
Ze Zhang
Göteborgs universitet
Chalmers, Data- och informationsteknik, Dator- och nätverkssystem
Karinne Ramirez-Amaro
Chalmers, Elektroteknik, System- och reglerteknik
Emmanuel Dean
Chalmers, Elektroteknik, System- och reglerteknik
2026 IEEE SICE International Symposium on System Integration Sii 2026
722-728
9781665457842 (ISBN)
Cancun, Mexico,
Ämneskategorier (SSIF 2025)
Robotik och automation
Datavetenskap (datalogi)
DOI
10.1109/SII64115.2026.11404492