Loading market data...

Indiske arbeidere får $2,40 timen for å filme hverdagslige handlinger for AI-trening

Indiske arbeidere får $2,40 timen for å filme hverdagslige handlinger for AI-trening

Indiske arbeidere fester smarttelefoner på hodet og filmer hverdagsrutinene sine – matlaging, rengjøring, gåing, handling – for omtrent 250 rupier ($2,40) timen. Opptakene brukes til å trene kunstig intelligens-systemer, spesielt for menneskelignende roboter som må forstå hvordan mennesker beveger seg og samhandler med verden.

Slik samles opptakene inn

Arbeiderne har på seg en smarttelefon montert på et pannebånd eller en sele, og tar opp førstepersonsvideo av vanlige oppgaver. Lønnen – omtrent $2,40 per time – er lav etter globale standarder, men konkurransedyktig i deler av India der lønnen for lignende gig-arbeid varierer fra 150 til 300 rupier timen. Arbeiderne navngis ikke i rapportene, men de er en del av en voksende arbeidsstyrke som leverer råmateriale til AI-trening.

Hodemontert tilnærming fanger det som kalles egosentriske opptak: video fra brukerens perspektiv. Dette er forskjellig fra tredjepersonsvideo, som viser hele kroppen. Egosentriske data hjelper AI-modeller med å lære hvordan et robots kamera ville se verden hvis det var montert på en menneskelignende overkropp eller hode.

Selskaper som behandler dataene

To selskaper er kjent for å være involvert i å omdanne råvideo til brukbare treningsdata. Objectways, basert i USA, men med virksomhet i India, spesialiserer seg på dataannotering for AI. Humyn Lab, basert i Bangalore, fokuserer på menneskesentrert datainnsamling og merking. Begge firmaene tar egosentriske opptak og legger til metadata – avgrensningsbokser, handlingsetiketter, objektkoder – som maskinlæringsmodeller trenger for å lære.

Arbeidet er omhyggelig. Hvert sekund av video kan kreve flere minutter med menneskelig annotering for å identifisere hva som skjer: en hånd som strekker seg etter en kopp, en fot som trår over en dørterskel, en person som åpner en dør. De resulterende datasettene selges eller lisensieres deretter til AI-utviklere som bygger roboter og virtuelle assistenter.

Investorvurderinger anslår at markedet for menneskelignende roboter vil nå 38 milliarder dollar innen 2035. Den veksten avhenger av roboter som kan navigere i menneskelige omgivelser – hjem, kontorer, fabrikker – uten å kollidere med møbler eller misforstå en gest. Å trene disse robotene krever store mengder førstepersonsvideo som viser hvordan mennesker faktisk oppfører seg, ikke bare iscenesatte handlinger i et laboratorium.

De indiske arbeidernes opptak fyller et hull. De fleste eksisterende egosentriske datasettene kommer fra forskere eller frivillige i rike land. De indiske dataene tilfører variasjon: forskjellige hjem, forskjellige gjenstander, forskjellige kulturelle rutiner. Det mangfoldet hjelper AI-systemer med å generalisere bedre, selv om det også reiser spørsmål om arbeidsforhold og samtykke.

Arbeidet fortsetter. Etterspørselen etter treningsdata avtar ikke, og de involverte selskapene vil sannsynligvis fortsette å ansette. For nå filmer arbeiderne, annotatørene merker, og robotene lærer – én 250-rupie-time om gangen.