Ett forskarteam på totalförsvarets forskningsinstitut (FOI) har tagit fram nya metoder och skrivit en rapport kring ny AI-teknik som kan göra datorgenererade styrkor mer realistiska. På det sättet kan Försvarsmaktens övningar bli bättre och mer effektiva.
– Det skulle innebära en besparing av tid och resurser, säger Farzad Kamrani, en av forskarna bakom studien Beteendemodellering med imitationsinlärning.
AI-teknik kan göra Försvarsmaktens övningar bättre och mer effektiva.
Foto: Försvarsmakten
Målet med studien var att undersöka hur man kan minimera mänsklig handpåläggning vid skapande av så kallade datorgenererade styrkor (eller agenter) för simulatorer. I dag utvecklas datorgenererade styrkor med traditionella programmeringstekniker. Metoden för utveckling är en process där taktik, kunskap och erfarenhet från militära experter successivt översätts till datorkod. Det är en komplex, tidskrävande och kostsam uppgift.
Simuleringar används redan i dag för militära övningar och som stöd för beslut. De fungerar bra för att modellera omgivningar och objekt som fordon och vapen exempelvis. Men det finns enligt forskarna fortfarande mycket att önska när det gäller simulering av mänskligt beteende.
– Vi är ännu väldigt mycket på forskningsstadiet. Man kan tänka sig att AI (artificiell intelligens) i framtiden kan planera strategier som är bättre än de en människa kan tänka ut. Men det krävs mycket forskning och datorresurser för att få fram resultat som är tillräckligt pålitliga, säger Farzad Kamrani.
Inlärning via imitation
En av de prövade teknikerna var imitationsinlärning. Det är vad det låter som – en agent tränas att imitera mänskligt beteende. Det kan exempelvis ske genom att en människa deltar i en simulering, en programvara registrerar alla val hen gör, och detta upprepas till en tillräcklig mängd data samlas. Sedan tränas AI-agenten med hjälp av den data som blivit insamlad, innan den testats i simuleringen. På så sätt är förhoppningen att forskarna ska få fram mer människolikt beteende, vilket skulle gynna militära övningar i simulatorer.
I ett av försöken tränades en agent att imitera ett inspelat mänskligt beteende. En mänsklig förare styrde en bil i en simulator samtidigt som skärmbilder och data från styrspaken föraren använde kontinuerligt registrerades. De här uppgifterna användes för att träna ett djupt neuronnätverk, som sedan visade sig vara kapabelt att styra bilen i miljöer den inte kände till.
Ett experiment använde en metod som kallas för ”inverterad förstärkt inlärning”. Där försöker agenten lära sig de underliggande värderingar som det mänskliga beteendet är baserat på i stället för att bara repetera det. Forskarna testade hur AI kunde klara en taktisk förflyttning i fiendeland. De ville undersöka om agenten kunde ta sig från punkt a till punkt b endast med hjälp av exempeldata på hur en beslutfattare hade utfört uppgiften, utan att ha explicit kunskap om vad denne baserar sina beslut på. Till exempel hur agenten gör för att ta den kortaste vägen, samtidigt som den vill undvika fientliga ögon. Experimentet visade på potential, men det kräver stor datorkraft för att kunna genomföras.
– Det skulle innebära en besparing av tid och resurser att få fram simulatorer där resultaten är korrekta för träning och beslutsstöd. I simulatorer där agenterna inte är realistiska kan resultaten bli helt tokiga, säger Farzad Kamrani.
Forskningen är en del av Försvarsmaktens stora satsning på AI. Inom Markstridsskolan finns exempelvis möjligheten att simulera hur evakuering av en ort kan se ut, och vilken eller vilka städer som får ta emot den efterföljande flyktingströmmen.
Det är enligt FOI ett ungt fält och mycket arbete återstår att göra. Utvecklingen går dock snabbt framåt.
– Det är väldigt spännande att jobba med AI i allmänhet och imitationsinlärning i synnerhet. Det kommer dagligen nya artiklar och forskningsresultat och man vill bara lära sig nya tekniker och metoder, säger Farzad Kamrani.
Länk till rapporten: Beteendemodellering med imitationsinlärning