Loading market data...

Muncitori indieni plătiți cu 2,40 $ pe oră pentru a filma acțiuni cotidiene pentru antrenamentul AI

Muncitori indieni plătiți cu 2,40 $ pe oră pentru a filma acțiuni cotidiene pentru antrenamentul AI

Muncitorii indieni își fixează smartphone-uri montate pe cap și își filmează rutina zilnică — gătit, curățenie, mers pe jos, cumpărături — pentru aproximativ 250 de rupii (2,40 $) pe oră. Imaginile sunt folosite pentru a antrena sisteme de inteligență artificială, în special pentru roboți umanoizi care trebuie să înțeleagă cum se mișcă oamenii și cum interacționează cu lumea.

Cum sunt colectate imaginile

Muncitorii poartă un smartphone montat pe o bandă pentru cap sau pe un ham, înregistrând video la persoana întâi a sarcinilor obișnuite. Plata — aproximativ 2,40 $ pe oră — este scăzută după standardele globale, dar competitivă în părți ale Indiei unde salariile pentru munci similare la cerere variază între 150 și 300 de rupii pe oră. Muncitorii nu sunt numiți în rapoarte, dar fac parte dintr-o forță de muncă în creștere care furnizează materia primă pentru antrenamentul AI.

Abordarea cu montare pe cap capturează ceea ce se numește materiale egocentrice: video din punctul de vedere al purtătorului. Aceasta este diferită de video la persoana a treia, care arată întregul corp. Datele egocentrice ajută modelele AI să învețe cum ar vedea lumea camera unui robot dacă ar fi montată pe trunchiul sau capul unui umanoid.

Companiile care procesează datele

Se știe că două companii sunt implicate în transformarea acestor imagini brute în date de antrenament utilizabile. Objectways, cu sediul în SUA, dar cu operațiuni în India, se specializează în adnotarea de date pentru AI. Humyn Lab, cu sediul în Bangalore, se concentrează pe colectarea și etichetarea datelor centrate pe om. Ambele firme preiau materialele egocentrice și adaugă metadate — casete de delimitare, etichete de acțiuni, etichete de obiecte — de care modelele de învățare automată au nevoie pentru a învăța.

Munca este migăloasă. Fiecare secundă de video poate necesita câteva minute de adnotare umană pentru a identifica ce se întâmplă: o mână care ajunge la o ceașcă, un picior care trece peste un prag, o persoană care deschide o ușă. Seturile de date rezultate sunt apoi vândute sau licențiate dezvoltatorilor de AI care construiesc roboți și asistenți virtuali.

Evaluările investitorilor proiectează că piața roboților umanoizi va atinge 38 de miliarde de dolari până în 2035. Această creștere depinde de roboți care pot naviga în medii umane — case, birouri, fabrici — fără să se lovească de mobilă sau să interpreteze greșit un gest. Antrenarea acestor roboți necesită cantități imense de video la persoana întâi care arată cum se comportă oamenii cu adevărat, nu doar acțiuni regizate într-un laborator.

Imaginile muncitorilor indieni umplu un gol. Majoritatea seturilor de date egocentrice existente provin de la cercetători sau voluntari din țări bogate. Datele indiene adaugă varietate: diferite case, diferite obiecte, diferite rutine culturale. Această diversitate ajută sistemele AI să generalizeze mai bine, deși ridică și întrebări despre condițiile de muncă și consimțământ.

Munca continuă. Cererea de date de antrenament nu încetinește, iar companiile implicate probabil vor continua să angajeze. Deocamdată, muncitorii filmează, adnotatorii etichetează, iar roboții învață — câte o oră de 250 de rupii odată.