Loading market data...

Индийские работники получают 2,40 доллара в час за съёмку повседневных действий для обучения ИИ

Индийские работники получают 2,40 доллара в час за съёмку повседневных действий для обучения ИИ

Индийские работники крепят смартфоны на голову с помощью повязок и снимают свои повседневные дела — приготовление еды, уборку, прогулки, покупки — примерно за 250 рупий (2,40 доллара) в час. Эти кадры используются для обучения систем искусственного интеллекта, особенно человекоподобных роботов, которым необходимо понимать, как люди двигаются и взаимодействуют с миром.

Как собираются кадры

Работники носят смартфон на головной повязке или ремне, записывая видео от первого лица во время обычных задач. Оплата — примерно 2,40 доллара в час — низка по мировым стандартам, но конкурентоспособна в некоторых регионах Индии, где заработок за аналогичную работу по найму составляет от 150 до 300 рупий в час. В отчётах работники не названы по имени, но они являются частью растущей рабочей силы, поставляющей сырьё для обучения ИИ.

Подход с креплением на голове позволяет получить так называемое эгоцентричное видео: запись с точки зрения носителя. Это отличается от видео от третьего лица, где видно всё тело. Эгоцентричные данные помогают моделям ИИ понять, как камера робота видела бы мир, если бы была установлена на торсе или голове человекоподобного робота.

Компании, обрабатывающие данные

Известно о двух компаниях, которые занимаются преобразованием этих сырых видео в пригодные для обучения данные. Objectways, базирующаяся в США, но имеющая офисы в Индии, специализируется на аннотации данных для ИИ. Humyn Lab, расположенная в Бангалоре, фокусируется на сборе и разметке данных, ориентированных на человека. Обе фирмы добавляют к эгоцентричному видео метаданные — ограничивающие рамки, метки действий, теги объектов — которые необходимы моделям машинного обучения.

Эта работа требует кропотливости. Каждая секунда видео может потребовать нескольких минут ручной разметки, чтобы определить, что происходит: рука тянется к чашке, нога переступает через порог, человек открывает дверь. Полученные наборы данных затем продаются или лицензируются разработчикам ИИ, создающим роботов и виртуальных помощников.

По оценкам инвесторов, рынок человекоподобных роботов достигнет 38 миллиардов долларов к 2035 году. Такой рост зависит от роботов, способных ориентироваться в человеческой среде — домах, офисах, фабриках — не натыкаясь на мебель и не истолковывая жесты неправильно. Для обучения таких роботов требуются огромные объёмы видео от первого лица, показывающего, как люди ведут себя в реальности, а не только постановочные действия в лаборатории.

Кадры индийских работников заполняют пробел. Большинство существующих эгоцентричных наборов данных получены от исследователей или волонтёров из богатых стран. Индийские данные добавляют разнообразие: разные дома, разные предметы, разные культурные привычки. Это разнообразие помогает системам ИИ лучше обобщать, хотя и поднимает вопросы об условиях труда и согласии.

Работа продолжается. Спрос на обучающие данные не снижается, и участвующие компании, вероятно, продолжат нанимать людей. Пока работники снимают видео, аннотаторы размечают, а роботы учатся — по одной 250-рупийной оплате за час.