Loading market data...

Індійські працівники отримують $2.40 за годину, знімаючи повсякденні дії для навчання ШІ

Індійські працівники отримують $2.40 за годину, знімаючи повсякденні дії для навчання ШІ

Індійські працівники кріплять смартфони на голову за допомогою пов'язок або ременів і знімають свої повсякденні справи — приготування їжі, прибирання, прогулянки, покупки — за приблизно 250 рупій ($2.40) на годину. Ці відеоматеріали використовуються для навчання систем штучного інтелекту, особливо людиноподібних роботів, які повинні розуміти, як люди рухаються та взаємодіють зі світом.

Як збираються відеоматеріали

Працівники носять смартфон, закріплений на головній пов'язці або ремені, записуючи відео від першої особи під час виконання звичайних завдань. Оплата — приблизно $2.40 за годину — низька за світовими стандартами, але конкурентоспроможна в деяких регіонах Індії, де заробітна плата за подібну роботу коливається від 150 до 300 рупій на годину. Працівники не названі в звітах, але вони є частиною зростаючої робочої сили, яка постачає сировину для навчання ШІ.

Такий підхід із кріпленням на голові дозволяє отримувати так зване егоцентричне відео: запис із точки зору носія. Це відрізняється від відео від третьої особи, яке показує все тіло. Егоцентричні дані допомагають моделям ШІ навчитися бачити світ так, як його бачила б камера робота, якби вона була встановлена на тулубі або голові людиноподібного робота.

Компанії, що обробляють дані

Відомо про дві компанії, які займаються перетворенням цих сирих відео на корисні навчальні дані. Objectways, що базується в США, але має операції в Індії, спеціалізується на анотації даних для ШІ. Humyn Lab, розташована в Бенгалуру, зосереджується на зборі та маркуванні даних, орієнтованих на людину. Обидві фірми додають до егоцентричних відео метадані — обмежувальні рамки, мітки дій, теги об'єктів — які необхідні моделям машинного навчання для навчання.

Ця робота кропітка. Кожна секунда відео може вимагати кількох хвилин людської анотації, щоб визначити, що відбувається: рука тягнеться до чашки, нога переступає поріг, людина відчиняє двері. Отримані набори даних потім продаються або ліцензуються розробникам ШІ, які будують роботів і віртуальних помічників.

За оцінками інвесторів, ринок людиноподібних роботів досягне $38 мільярдів до 2035 року. Таке зростання залежить від роботів, які можуть орієнтуватися в людському середовищі — будинках, офісах, фабриках — не наштовхуючись на меблі та не неправильно тлумачачи жести. Для навчання таких роботів потрібні величезні обсяги відео від першої особи, які показують, як люди насправді поводяться, а не лише постановочні дії в лабораторії.

Відеоматеріали індійських працівників заповнюють прогалину. Більшість існуючих егоцентричних наборів даних походять від дослідників або волонтерів у багатих країнах. Індійські дані додають різноманіття: різні домівки, різні об'єкти, різні культурні звичаї. Ця різноманітність допомагає системам ШІ краще узагальнювати, хоча також викликає питання щодо умов праці та згоди.

Робота триває. Попит на навчальні дані не зменшується, і компанії, залучені до цього процесу, ймовірно, продовжуватимуть наймати. Поки що працівники знімають, анотатори маркують, а роботи навчаються — по одній годині за 250 рупій.