Robust och precis semi-övervakad inlärning
Forskningsprojekt, 2020 – 2024

De stora framgångarna de se åren för AI har varit baserade på Supervised Learning (SL) metoder, drivna av stora mängder parallell beräkningskraft och mänskligt annoterad träningsdata. Men vi är nu vid en punkt där det börjar bli utmanande att manuellt annotera nya datamängder som är av tillräcklig kvantitet och kvalitet för att ytterligare driva utvecklingen framåt. Dessutom finns det sensormodaliteter, t.ex. radar, där tillgången på annoterad data är knapp och där den, i motsats till bilddata, kräver expertdomänkunskap för att etikettera data exakt vilket gör det ännu dyrare.

Istället tror många att Semi-Supervised Learning (SSL) kommer att driva nästa AI-revolution. Här vill man använda den stora mängden omärkt data (och några etiketterade exempel) för att lära sig de koncept och bakomliggande faktorer som behövs när vi tolkar det vi ser omkring oss. Vidare, med hjälp av SSL kan vi potentiellt ha system som kontinuerligt och automatiskt lär sig och anpassar sig under hela sin livscykel. Under det senaste året har vi sett den första indikationen på detta, där SSL-metoder har överträffat SL på bildklassificeringsuppgifter, även om stora mängder märkt data finns tillgängliga [1,2]. Grundförutsättningen för dessa SSL-algoritmer, och som gör dem så effektiva, är att de utnyttjar prediktionskonsistens (pseudo-etiketter) mellan svagt och starkt förstärkta/förvrängda versioner av samma bild. Ett annat exempel är [3] där geometriska överensstämmelser används för att träna en modell för att producera konsekventa semantiska etiketter över olika årstider.

I det här projektet siktar vi på att utöka SSL-revolutionen genom att utveckla mer robusta och exakta SSL-scheman som generaliserar till nya situationer. Vårt fokus ligger på (i) att förbättra hur modellosäkerhet beaktas under utbildning och (ii) att anpassa insikterna från nuvarande banbrytande SSL-scheman för bilduppgifter på hög nivå att använda på de ovan nämnda förutsägelsekonsistensen. Dessutom planerar vi att utöka vårt SSL-schema till nya situationer genom att t.ex. använda inspiration från [1, 2] för att utforska förstärkningsscheman för radar- och lidardata som samlats in från SAAB:s övervakningssystem och att använda vår expertis inom klassiska Bayesianska sensorfusionsalgoritmer för att bygga upp ytterligare förtroende och koppla samman oetiketterad data både över tid och modaliteter. Att ta de första stegen mot verkligt självlärande system.

[1] Chen, Ting, et al. "A simple framework for contrastive learning of visual representations." arXiv, 2020.

[2] Sohn et al. "FixMatch: Simplifying semi-supervised learning with consistency and confidence", arXiv, 2020.

[3] Hammarstrand, Kahl et al. "A cross-season correspondence dataset for robust semantic segmentation", CVPR, 2019.

Deltagare

Lars Hammarstrand (kontakt)

Chalmers, Elektroteknik, Signalbehandling och medicinsk teknik

Fredrik Kahl

Chalmers, Elektroteknik, Signalbehandling och medicinsk teknik

Lennart Svensson

Chalmers, Elektroteknik, Signalbehandling och medicinsk teknik

Erik Wallin

Chalmers, Elektroteknik, Signalbehandling och medicinsk teknik

Samarbetspartners

Saab

Stockholm, Sweden

Finansiering

Wallenberg AI, Autonomous Systems and Software Program

Finansierar Chalmers deltagande under 2020–2024

Relaterade styrkeområden och infrastruktur

Informations- och kommunikationsteknik

Styrkeområden

Publikationer

Mer information

Senast uppdaterat

2022-05-10