Indian Workers Paid $2.40 an Hour to Film Everyday Actions for AI Training

How the footage is collected

" -> "

Görüntüler nasıl toplanıyor

" Then paragraph: "Workers wear a smartphone mounted on a headband or a harness, recording first-person video of ordinary tasks. The pay — roughly $2.40 per hour — is low by global standards but competitive in parts of India where wages for similar gig work range from 150 to 300 rupees an hour. The workers are not named in the reports, but they are part of a growing labor force that supplies the raw material for AI training." Translation: "İşçiler, bir kafa bandına veya koşum takımına monte edilmiş bir akıllı telefon takarak sıradan görevlerin birinci şahıs videosunu kaydediyor. Ücret — saatte yaklaşık 2,40 dolar — küresel standartlara göre düşük, ancak benzer geçici işler için saat ücretlerinin 150 ila 300 rupi arasında değiştiği Hindistan'ın bazı bölgelerinde rekabetçi. Raporlarda işçilerin isimleri verilmiyor, ancak yapay zeka eğitimi için hammadde sağlayan büyüyen bir iş gücünün parçasılar." Next: "The head-mounted approach captures what is called egocentric footage: video from the wearer's point of view. This is different from third-person video, which shows the whole body. Egocentric data helps AI models learn how a robot's camera would see the world if it were mounted on a humanoid torso or head." Translation: "Kafa monteli yaklaşım, benmerkezci (egocentric) görüntü olarak adlandırılan şeyi yakalar: kullanıcının bakış açısından video. Bu, tüm vücudu gösteren üçüncü şahıs videosundan farklıdır. Benmerkezci veriler, yapay zeka modellerinin, bir robotun kamerasının insansı bir gövdeye veya kafaya monte edilmesi durumunda dünyayı nasıl göreceğini öğrenmesine yardımcı olur." Third section: "

Companies processing the data

" -> "

Veriyi işleyen şirketler

" Then: "Two companies are known to be involved in turning this raw video into usable training data. Objectways, based in the U.S. but with operations in India, specializes in data annotation for AI. Humyn Lab, based in Bangalore, focuses on human-centric data collection and labeling. Both firms take the egocentric footage and add metadata — bounding boxes, action labels, object tags — that machine learning models need to learn from." Translation: "Bu ham videoyu kullanılabilir eğitim verisine dönüştürmekle ilgili olduğu bilinen iki şirket var. Merkezi ABD'de bulunan ancak Hindistan'da operasyonları olan Objectways, yapay zeka için veri etiketleme konusunda uzmanlaşmıştır. Bangalore merkezli Humyn Lab ise insan merkezli veri toplama ve etiketlemeye odaklanmaktadır. Her iki firma da benmerkezci görüntüleri alır ve makine öğrenimi modellerinin öğrenmesi gereken meta verileri — sınırlayıcı kutular, eylem etiketleri, nesne etiketleri — ekler." Next paragraph: "The work is painstaking. Each second of video may require several minutes of human annotation to identify what is happening: a hand reaching for a cup, a foot stepping over a threshold, a person opening a door. The resulting datasets are then sold or licensed to AI developers building robots and virtual assistants." Translation: "İş titizlik gerektirir. Videonun her saniyesi, neler olduğunu belirlemek için birkaç dakikalık insan etiketlemesi gerektirebilir: bir elin bardağa uzanması, bir ayağın eşiği aşması, bir kişinin kapıyı açması. Ortaya çıkan veri kümeleri daha sonra robotlar ve sanal asistanlar geliştiren yapay zeka geliştiricilerine satılır veya lisanslanır." Next: "Investor assessments project the humanoid robot market will reach $38 billion by 2035. That growth depends on robots that can navigate human environments — homes, offices, factories — without bumping into furniture or misreading a gesture. Training those robots requires vast amounts of first-person video showing how people actually behave, not just staged actions in a lab." Translation: "Yatırımcı değerlendirmeleri, insansı robot pazarının 2035 yılına kadar 38 milyar dolara ulaşacağını öngörüyor. Bu büyüme, mobilyalara çarpmadan veya bir jesti yanlış yorumlamadan insan ortamlarında — evler, ofisler, fabrikalar — gezinebilen robotlara bağlıdır. Bu robotları eğitmek, yalnızca laboratuvarda sahnelenen eylemleri değil, insanların gerçekte nasıl davrandığını gösteren çok büyük miktarda birinci şahıs video gerektirir." Next: "The Indian workers' footage fills a gap. Most existing egocentric datasets come from researchers or volunteers in wealthy countries. The Indian data adds variety: different homes, different objects, different cultural routines. That diversity helps AI systems generalize better, though it also raises questions about labor conditions and consent." Translation: "Hintli işçilerin görüntüleri bir boşluğu dolduruyor. Mevcut benmerkezci veri kümelerinin çoğu, zengin ülkelerdeki araştırmac

How the footage is collected

Görüntüler nasıl toplanıyor

Companies processing the data

Veriyi işleyen şirketler

İlgili Haberler