Fei-Fei Li, tekoälyn tutkimuksen veteraani, on esittänyt uuden kehyksen maailmamalleille, jonka tavoitteena on antaa koneille paljon syvempi ymmärrys fyysisestä tilasta. Jos ehdotus toteutuu, se voisi antaa roboteille mahdollisuuden navigoida ja käsitellä ympäristöään sellaisella ymmärryksen tasolla, jota nykyisestä tekoälystä pitkälti puuttuu.
Miksi maailmamallit ovat tärkeitä
Useimmat nykyiset tekoälyjärjestelmät näkevät maailman litteinä kuvina tai abstraktina datana. Ne eivät oikeasti ymmärrä, että tuoli on jotain, jolla istutaan, että seinän läpi ei voi kävellä tai että kuppi putoaa, jos se työnnetään pöydältä. Lin kehys pyrkii korjaamaan tämän rakentamalla niin sanotun maailmamallin — sisäisen esityksen ympäristöstä, joka sisältää geometrian, fysiikan ja esineiden väliset suhteet.
Tällainen avaruudellinen älykkyys on ratkaisevan tärkeää roboteille, joiden on työskenneltävä kotona, varastoissa tai sairaaloissa. Imuri, joka ei ymmärrä kulmia, törmää niihin. Jakeludrooni, joka ei osaa ennustaa tuulta, saattaa pudottaa paketin. Lin lähestymistapa lupaa ylittää nämä rajat antamalla tekoälyn simuloida mahdollisia toimia ennen kuin se toteuttaa ne.
Simulaatiosta todellisuuteen
Kehys ei ole vain parempia karttoja. Kyse on oppimisesta, miten maailma toimii. Malli kävisi läpi hypoteettisia skenaarioita — mitä tapahtuu, jos robotti työntää laatikkoa, tai jos ihminen kävelee sen eteen — ja päivittäisi ymmärrystään sen perusteella, mitä todella tapahtuu. Tämä palautesilmukka voisi tehdä roboteista mukautuvampia ja turvallisempia.
Li on työskennellyt avaruudellisen älykkyyden parissa vuosia. Hänen aiempi tutkimuksensa kuvantunnistuksesta auttoi opettamaan tietokoneita tunnistamaan esineitä. Tämä uusi ponnistus menee askeleen pidemmälle: ei vain näkemistä, vaan päättelyä tilasta. Maailmamalli toimii kuin sisäinen fysiikkamoottori, antaen tekoälyn ennustaa tuloksia ilman, että sen täytyy kokeilla jokaista toimintoa todellisessa maailmassa.
Haasteita edessä
Luotettavan maailmamallin rakentaminen on vaikeaa. Todelliset ympäristöt ovat sotkuisia. Valaistus muuttuu, esineet liikkuvat, ihmiset käyttäytyvät arvaamattomasti. Lin kehyksen on kyettävä käsittelemään tätä kaaosta hajoamatta. Myös laskentakustannukset ovat korkeat — yksityiskohtaisten simulointien suorittaminen jokaiselle päätökselle vaatii vakavaa prosessointitehoa.
Tutkija ei ole vielä julkaissut tuloksia laajamittaisesta testistä. Kehys on kuvattu tuoreessa artikkelissa, mutta todellinen testi on se, toimiiko se laboratorion ulkopuolella. Robotti, joka pystyy rakentamaan ja käyttämään maailmamallia lennossa, olisi suuri harppaus nykyisiin järjestelmiin verrattuna, jotka tukeutuvat enimmäkseen ennalta ohjelmoituihin sääntöihin tai valtaviin merkittyjen esimerkkien tietoaineistoihin.
Muutkin laboratoriot etenevät samaan suuntaan. DeepMind, OpenAI ja joukko yliopistoryhmiä ovat kaikki ehdottaneet maailmamalli-ideoita. Lin versio erottuu keskittymällä avaruudelliseen päättelyyn — sellaiseen ymmärrykseen, jota ihminen käyttää kävellessään tungoksisen huoneen läpi törmäämättä keneenkään.
On avoin kysymys, pystyykö kehys skaalautumaan simulaatioiden ulkopuolella sotkuisiin, dynaamisiin ympäristöihin. Lin tiimi todennäköisesti työskentelee tämän parissa parhaillaan, mutta toimivan prototyypin aikataulusta ei ole annettu tietoa.




