Fei-Fei Lis rammeværk for verdensmodeller sigter mod AIs rumlige blinde punkt

Fei-Fei Li, en erfaren forsker inden for kunstig intelligens, har præsenteret et nyt rammeværk for verdensmodeller, der skal give maskiner en langt dybere forståelse af fysisk rum. Forslaget, hvis det lykkes, kunne give robotter mulighed for at navigere og manipulere deres omgivelser med et niveau af forståelse, som nuværende AI stort set mangler.

Hvorfor verdensmodeller er vigtige

De fleste AI-systemer i dag ser verden som flade billeder eller abstrakte data. De forstår ikke rigtigt, at en stol er noget, man sidder på, at en væg ikke kan gås igennem, eller at en kop falder, hvis den skubbes ud over et bord. Lis rammeværk forsøger at løse dette ved at opbygge det, hun kalder en verdensmodel – en intern repræsentation af miljøet, der inkluderer geometri, fysik og forholdet mellem objekter.

Den slags rumlig intelligens er afgørende for robotter, der skal arbejde i hjem, lagre eller hospitaler. En støvsuger, der ikke forstår hjørner, støder ind i dem. En leveringsdrone, der ikke kan forudsige vinden, taber måske en pakke. Lis tilgang lover at bevæge sig ud over disse begrænsninger ved at lade en AI simulere mulige handlinger, før de udføres.

Fra simulation til virkelighed

Rammeværket handler ikke kun om bedre kort. Det handler om at lære, hvordan verden opfører sig. Modellen ville køre igennem hypotetiske scenarier – hvad sker der, hvis robotten skubber en kasse, eller hvis en person går foran den – og opdatere sin forståelse baseret på, hvad der faktisk sker. Den feedback-loop kunne gøre robotter mere tilpasningsdygtige og sikrere.

Li har arbejdet med rumlig intelligens i årevis. Hendes tidligere forskning i billedgenkendelse hjalp med at træne computere til at identificere objekter. Dette nye initiativ går et skridt videre: ikke kun at se, men at ræsonnere om rum. Verdensmodellen fungerer som en slags intern fysikmotor, der lader AI forudsige resultater uden at skulle afprøve hver handling i den virkelige verden.

Udfordringer forude

At opbygge en pålidelig verdensmodel er svært. Virkelige miljøer er rodede. Belysningen ændrer sig, objekter flytter sig, mennesker opfører sig uforudsigeligt. Lis rammeværk skal kunne håndtere dette kaos uden at bryde sammen. Beregningsomkostningerne er også høje – at køre detaljerede simulationer for hver beslutning kræver alvorlig processorkraft.

Forskeren har endnu ikke offentliggjort resultater fra en storstilet test. Rammeværket er beskrevet i et nyligt papir, men den rigtige test vil være, om det fungerer uden for et laboratorium. En robot, der kan opbygge og bruge en verdensmodel på farten, ville være et stort fremskridt i forhold til nutidens systemer, som for det meste er afhængige af forudprogrammerede regler eller massive datasæt af mærkede eksempler.

Andre laboratorier arbejder i lignende retninger. DeepMind, OpenAI og en håndfuld universitetsgrupper har alle foreslået verdensmodel-ideer. Lis version skiller sig ud for sit fokus på rumlig ræsonnering – den slags forståelse, et menneske bruger til at gå gennem et fyldt rum uden at støde ind i nogen.

Om rammeværket kan skaleres ud over simulationer til rodede, dynamiske miljøer er et åbent spørgsmål. Lis team arbejder sandsynligvis på det nu, men der er ikke givet nogen tidsplan for en fungerende prototype.

Hvorfor verdensmodeller er vigtige

Fra simulation til virkelighed

Udfordringer forude

Related Articles