Identifiering av underliggande incitament via invers optimal styrning
Forskningsprojekt, 2025
– 2028
Invers optimal styrning är en form av baklängeskonstruktion, eller ”reverse engineering”, där mål, incitamenten, och preferenser som styr ett beteende identifieras från observationer av hur en agenten beter sig.Här ska ordet agent tolkas i vid mening:
Invers optimal styrning är en form av baklängeskonstruktion, eller ”reverse engineering”, där mål, incitamenten, och preferenser som styr ett beteende identifieras från observationer av hur en agenten beter sig. Här ska ordet agent tolkas i vid mening: det kan vara en människa, ett djur, en växt, eller ett tekniskt system som vi har byggt för att utföra vissa uppgifter, t.ex. en självkörande bil. Med andra ord handlar invers optimal styrning om att besvara frågan: vilken typ av belöning eller kostnad kan förklara varför en agent beter sig på det sätt som den gör?Oavsett om en agent försöker maximera en belöning eller minimera en kostnad så säger vi att den försöker optimera en målfunktion. Invers optimal styrning är användbart eftersom en svårighet vi konstruktion av nya tekniska system är att designa en bra målfunktion. Det eftersom det ofta är svårt att förutsäga hur en agent kommer att bete sig genom att enbart titta på den målfunktion som agenten försöker optimera. För att få ett önskat beteende på en ny typ av agenter i ett tekniskt system vi designar, skulle vi istället kunna titta på hur liknande, redan existerande agenter beter sig, och identifiera deras målfunktion. De finns således många potentiella partiska tillämpningar av invers optimal styrning inom t.ex. autonoma fordon. Men tillämpningar finns även in områden som energisystem – genom att modelera kunders preferenser kan beteenden på elmarknaden förutspås och energisystemet anpassas därefter – eller robotik – genom att ge en robot en förståelse för en människas mål kan den anpassa sitt beteende och där med bättre samarbete tillsammans med en människa.Det finns dock flera matematiska svårigheter när man försöker lösa inversproblemet, t.ex. att kunna bevisa att den identifierade målfunktionen faktiskt är den sanna underliggande målfunktionen. Denna forskning ämnar ta fram nya metoder och verktyg för att lösa inversproblemet, där vissa typer av garantier för ”korrekthet” kan ges.
Deltagare
Axel Ringh (kontakt)
Chalmers, Matematiska vetenskaper, Tillämpad matematik och statistik
Finansiering
Vetenskapsrådet (VR)
Projekt-id: 2024-05776
Finansierar Chalmers deltagande under 2025–2028