Indiske arbejdere spænder smartphones monteret på hovedet fast til ansigtet og filmer deres daglige rutiner – madlavning, rengøring, gåture, indkøb – for omkring 250 rupier (2,40 dollars) i timen. Optagelserne bruges til at træne kunstige intelligenssystemer, især humanoide robotter, der skal forstå, hvordan mennesker bevæger sig og interagerer med verden.
Sådan indsamles optagelserne
Arbejderne bærer en smartphone monteret på et pandebånd eller en sele, som optager førstepersonsvideo af almindelige opgaver. Lønnen – cirka 2,40 dollars i timen – er lav efter globale standarder, men konkurrencedygtig i dele af Indien, hvor lønnen for lignende gig-arbejde ligger på 150 til 300 rupier i timen. Arbejderne nævnes ikke ved navn i rapporterne, men de er en del af en voksende arbejdsstyrke, der leverer råmaterialet til AI-træning.
Hovedmonteringsmetoden indfanger det, der kaldes egocentrisk optagelse: video fra bærerens synsvinkel. Dette adskiller sig fra tredjepersonsvideo, som viser hele kroppen. Egocentriske data hjælper AI-modeller med at lære, hvordan en robots kamera ville se verden, hvis det var monteret på en humanoid torso eller et hoved.
Virksomheder, der behandler dataene
To virksomheder er kendt for at være involveret i at omdanne denne råvideo til brugbare træningsdata. Objectways, baseret i USA men med aktiviteter i Indien, specialiserer sig i dataannotation til AI. Humyn Lab, baseret i Bangalore, fokuserer på menneskecentreret dataindsamling og -mærkning. Begge virksomheder tager de egocentriske optagelser og tilføjer metadata – afgrænsningsbokse, handlingsetiketter, objekttags – som maskinlæringsmodeller har brug for at lære af.
Arbejdet er omhyggeligt. Hvert sekund af video kan kræve flere minutters menneskelig annotation for at identificere, hvad der sker: en hånd, der rækker efter en kop, en fod, der træder over en dørtærskel, en person, der åbner en dør. De resulterende datasæt sælges eller licenseres derefter til AI-udviklere, der bygger robotter og virtuelle assistenter.
Investorvurderinger forventer, at markedet for humanoide robotter vil nå 38 milliarder dollars i 2035. Den vækst afhænger af robotter, der kan navigere i menneskelige miljøer – hjem, kontorer, fabrikker – uden at støde ind i møbler eller misforstå en gestus. Træning af disse robotter kræver store mængder førstepersonsvideo, der viser, hvordan mennesker rent faktisk opfører sig, ikke kun iscenesatte handlinger i et laboratorium.
De indiske arbejderes optagelser udfylder et hul. De fleste eksisterende egocentriske datasæt kommer fra forskere eller frivillige i rige lande. De indiske data tilføjer variation: forskellige hjem, forskellige genstande, forskellige kulturelle rutiner. Den mangfoldighed hjælper AI-systemer med at generalisere bedre, selvom det også rejser spørgsmål om arbejdsforhold og samtykke.
Arbejdet fortsætter. Efterspørgslen efter træningsdata aftager ikke, og de involverede virksomheder vil sandsynligvis fortsætte med at ansætte. For nu filmer arbejderne, annotatorerne mærker, og robotterne lærer – én 250-rupis time ad gangen.




