Hierarkisk uppdragsplanering för autonoma agenter i osäkra miljöer

I samarbete med Saab Aeronautics utvecklar vi metoder för dynamiskt och intelligent beslutsfattande för autonoma agenter genom att kombinera optimeringsmetoder med inlärningsbaserade angreppssätt.

"Planer är värdelösa, men planering är oumbärlig." I mycket osäkra miljöer är förmågan att iterera och omarbeta den ursprungliga planen avgörande för utfallet, eftersom oväntade händelser med säkerhet kommer att inträffa.

Autonoma agenter, såsom obemannade (strids)flygplan – Unmanned (Combat) Aerial Vehicles, eller U(C)AV:er – är luftfarkoster som kan genomföra uppdrag utan direkt mänsklig styrning. Dessa mångsidiga plattformar är ovärderliga inom både militära och civila tillämpningar, särskilt i krävande miljöer. Den centrala utmaningen ligger dock i att möjliggöra snabba och intelligenta beslut under pågående uppdrag.

Förena inlärningsbaserade metoder och matematisk optimering

Artificiell intelligens, i synnerhet förstärkningsinlärning (eng. reinforcement learning (RL)), erbjuder stor potential vad gäller anpassningsförmåga, optimering och autonomt agerande. RL-metoder lär sig genom interaktion med omgivningen, men står inför utmaningar i asymmetriska situationer med heterogena agenter. Mångfalden av agenter ökar komplexiteten avsevärt, vilket försvårar inlärningen av effektiva strategier och leder till skalbarhetsproblem. Dessutom är RL:s prestanda starkt beroende av träningsdata, som i verkliga tillämpningar kan vara svår, dyr och riskfylld att samla in. Träning sker därför oftast i simulering, men skillnader mellan simulerade och verkliga miljöer kan leda till försämrad prestanda efter driftsättning. För att hantera detta krävs att agenter snabbt kan anpassa sig till nya förutsättningar, vilket är särskilt utmanande i komplexa och oförutsägbara situationer.

Operationsanalytiska metoder, såsom matematisk optimering och heuristiker, kräver ingen träning av agenter och är mindre beroende av stora datamängder. Dessa modeller kan konstrueras för att vara robusta mot osäkerhet och variationer i miljön, och de är väl lämpade för att hantera ett varierande antal heterogena agenter. Däremot är optimeringsbaserade metoder normalt sett mindre anpassade för mycket dynamiska och osäkra miljöer. Samtidigt som optimering erbjuder god tolkbarhet är datadrivna ”black-box”-metoder ofta enklare att implementera, eftersom de inte kräver förståelse för de interna mekanismerna.

Genom att kombinera RL och optimeringsmetoder kan man dra nytta av RL:s anpassningsförmåga i dynamiska miljöer och samtidigt utnyttja robustheten och tolkbarheten hos optimeringsbaserade metoder. Detta möjliggör mer effektiva och skalbara lösningar för komplexa uppdrag.

Ett hierarkiskt ramverk för uppdragsplanering

Flygplan. — Genom att kombinera inlärningsbaserade metoder med optimeringsbaserade angreppssätt till så kallade anytime-hybridmetoder kan de resulterande algoritmerna möjliggöra snabbare beslutsfattande och exekvering, vilket är avgörande för säkerheten i tidskritiska operationer.

I os盲kra milj枚er 盲r dynamisk omplanering i realtid avg枚rande. F枚r uppdrag med flera agenter blir denna uppgift snabbt mycket komplex. Ett hierarkiskt modellangreppss盲tt kan d氓 anv盲ndas, d盲r planeringen delas upp i tv氓 niv氓er: en 枚vergripande (h枚g) niv氓 och en detaljerad (l氓g) niv氓. Metoden p氓 h枚g niv氓 planerar 枚ver en l盲ngre tidshorisont genom resursallokering och schemal盲ggning samt anpassar den initiala planen vid behov. Metoden p氓 l氓g niv氓 fattar beslut om hur uppgifter ska genomf枚ras, med en kortare tidshorisont 盲n den 枚vergripande planeringen. RL-baserade metoder 盲r v盲l l盲mpade f枚r planering p氓 l氓g niv氓, medan optimeringsbaserade metoder ger ett b盲ttre l氓ngsiktigt perspektiv f枚r planering p氓 h枚g niv氓, s盲rskilt n盲r tillg氓ngen till tr盲ningsdata 盲r begr盲nsad.

Kontakt

Forskningsledare

Forskare

Caroline Granfeldt

Torbjörn Larsson

Professor

Organisation

Matematik och algoritmer för intelligent beslutsfattande

I omställningen mot en mer hållbar användning av resurser så är vårt bidrag att utveckla matematiska modeller och optimeringsmetoder för praktiskt relevanta men beräkningskrävande problem inom schemaläggning och resursallokering.

Illustrativ bild p氓 statistik och matematiok

Tillämpad matematik (TIMA)

Tillämpad matematik används för att studera avancerade metoder för modellering inom naturvetenskap, teknik och samhällsvetenskap. På avdelningen bedrivs forskning inom beräkningsmatematik, matematisk statistik och optimering.

Matematiska institutionen (MAI)

Vid institutionen bedrivs forskning och utbildning inom matematik och tillämpad matematik, beräkningsmatematik, matematisk statistik och optimeringslära. Undervisning ges på de flesta utbildningsprogrammen inom matematik, teknik och naturvetenskap.

Mer om forskning vid LiU

Forskning vid Linköpings universitet

Forskningen vid LiU har lett till flera världsledande forskningsmiljöer och företag. Förutom vetenskapliga frågeställningar strävar vi efter att ta oss an frågor som är till nytta för hela samhället.

福利姬