Loading market data...

인도 노동자, 일상 행동 촬영에 시간당 2.40달러 받아…AI 훈련용

인도 노동자, 일상 행동 촬영에 시간당 2.40달러 받아…AI 훈련용

인도 노동자들이 머리에 스마트폰을 부착한 헤드밴드를 쓰고 요리, 청소, 걷기, 쇼핑 등 일상적인 활동을 촬영하며 시간당 약 250루피(약 2.40달러)를 받고 있다. 이 영상은 인공지능 시스템, 특히 인간형 로봇이 사람들의 움직임과 상호작용 방식을 이해하는 데 필요한 훈련 데이터로 사용된다.

영상 수집 방식

노동자들은 헤드밴드나 하네스에 장착된 스마트폰을 착용하고 일상적인 작업을 1인칭 시점으로 녹화한다. 급여는 시간당 약 2.40달러로 세계적 기준으로는 낮지만, 유사한 긱 워크의 임금이 시간당 150~300루피인 인도 일부 지역에서는 경쟁력 있는 수준이다. 보고서에 따르면 이 노동자들의 신원은 공개되지 않았지만, AI 훈련용 원자재를 공급하는 성장하는 노동력의 일부다.

헤드 마운트 방식은 '자아 중심 영상(egocentric footage)'이라고 불리는 착용자의 시점에서 촬영된 영상을 포착한다. 이는 전신을 보여주는 3인칭 영상과는 다르다. 자아 중심 데이터는 AI 모델이 인간형 로봇의 몸통이나 머리에 장착된 카메라가 세상을 어떻게 보게 될지 학습하는 데 도움을 준다.

데이터 처리 기업

이 원시 영상을 사용 가능한 훈련 데이터로 전환하는 데 관여한 두 기업이 알려져 있다. 미국 기반이지만 인도에 지사를 둔 Objectways는 AI 데이터 주석 작업을 전문으로 한다. 방갈로르 기반의 Humyn Lab은 인간 중심 데이터 수집 및 레이블링에 주력한다. 두 기업 모두 자아 중심 영상에 메타데이터(경계 상자, 행동 레이블, 객체 태그)를 추가하여 머신러닝 모델이 학습할 수 있도록 한다.

이 작업은 매우 세심하다. 각 초의 영상에 대해 무엇이 일어나고 있는지(손이 컵을 잡으려는 동작, 발이 문턱을 넘는 동작, 사람이 문을 여는 동작 등)를 식별하기 위해 몇 분의 인간 주석 작업이 필요할 수 있다. 결과 데이터셋은 로봇과 가상 비서를 개발하는 AI 개발자에게 판매되거나 라이선스된다.

투자자 평가에 따르면 인간형 로봇 시장은 2035년까지 380억 달러에 이를 전망이다. 이러한 성장은 가구에 부딪히거나 제스처를 오해하지 않고 주택, 사무실, 공장 등 인간 환경을 탐색할 수 있는 로봇에 달려 있다. 그런 로봇을 훈련하려면 실험실에서 연출된 동작뿐 아니라 사람들이 실제로 행동하는 방식을 보여주는 방대한 양의 1인칭 영상이 필요하다.

인도 노동자들의 영상은 그 격차를 메운다. 기존의 자아 중심 데이터셋 대부분은 부유한 국가의 연구자나 자원봉사자로부터 나온다. 인도 데이터는 다양한 주택, 다양한 물건, 다양한 문화적 관행을 추가한다. 그 다양성은 AI 시스템이 더 잘 일반화하는 데 도움이 되지만, 노동 조건과 동의에 대한 의문도 제기한다.

작업은 계속된다. 훈련 데이터에 대한 수요는 줄어들지 않으며, 관련 기업들은 계속 고용할 가능성이 높다. 현재로서는 노동자들이 촬영하고, 주석 작업자가 레이블을 붙이며, 로봇이 배운다 — 한 번에 250루피씩.