Loading market data...

Indiska arbetare betalda 2,40 dollar i timmen för att filma vardagliga handlingar för AI-träning

Indiska arbetare betalda 2,40 dollar i timmen för att filma vardagliga handlingar för AI-träning

Indiska arbetare fäster smartphones på huvudet med hjälp av pannband och filmar sina dagliga rutiner – matlagning, städning, promenader, shopping – för cirka 250 rupier (2,40 dollar) i timmen. Filmen används för att träna artificiella intelligenssystem, särskilt för humanoider robotar som behöver förstå hur människor rör sig och interagerar med världen.

Så samlas filmen in

Arbetarna bär en smartphone monterad på ett pannband eller en sele och spelar in förstapersonsvideo av vanliga sysslor. Lönen – ungefär 2,40 dollar i timmen – är låg enligt globala mått men konkurrenskraftig i delar av Indien där löner för liknande gig-arbete ligger på 150 till 300 rupier i timmen. Arbetarna namnges inte i rapporterna, men de är en del av en växande arbetskraft som levererar råmaterial för AI-träning.

Metoden med huvudmonterad kamera fångar så kallad egocentrisk video: film från bärarens synvinkel. Detta skiljer sig från tredjepersonsvideo som visar hela kroppen. Egocentrisk data hjälper AI-modeller att lära sig hur en robots kamera skulle se världen om den var monterad på en humanoid torso eller huvud.

Företag som bearbetar datan

Två företag är kända för att omvandla denna råvideo till användbar träningsdata. Objectways, baserat i USA men med verksamhet i Indien, specialiserar sig på dataannotering för AI. Humyn Lab, baserat i Bangalore, fokuserar på människocentrerad datainsamling och märkning. Båda företagen tar den egocentriska filmen och lägger till metadata – avgränsningsrutor, handlingsetiketter, objektsetiketter – som maskininlärningsmodeller behöver för att lära sig.

Arbetet är mödosamt. Varje sekund video kan kräva flera minuters manuell annotering för att identifiera vad som händer: en hand som sträcker sig efter en kopp, en fot som kliver över en tröskel, en person som öppnar en dörr. De resulterande dataseten säljs eller licensieras sedan till AI-utvecklare som bygger robotar och virtuella assistenter.

Investeringsbedömningar förutspår att marknaden för humanoider robotar kommer att nå 38 miljarder dollar år 2035. Den tillväxten är beroende av robotar som kan navigera i mänskliga miljöer – hem, kontor, fabriker – utan att krocka med möbler eller misstolka en gest. Att träna dessa robotar kräver enorma mängder förstapersonsvideo som visar hur människor faktiskt beter sig, inte bara iscensatta handlingar i ett labb.

De indiska arbetarnas film fyller en lucka. De flesta befintliga egocentriska dataset kommer från forskare eller volontärer i rika länder. Den indiska datan tillför variation: olika hem, olika föremål, olika kulturella rutiner. Den mångfalden hjälper AI-system att generalisera bättre, även om det också väcker frågor om arbetsvillkor och samtycke.

Arbetet fortsätter. Efterfrågan på träningsdata avtar inte, och de inblandade företagen kommer sannolikt att fortsätta anställa. För tillfället filmar arbetarna, annoterarna märker, och robotarna lär sig – en 250-rupies timme i taget.