Google DeepMind a intégré les données de Street View à son système Project Genie pour créer des simulations immersives, offrant à l'IA un accès direct à la géographie réelle. Cette combinaison permet à la plateforme de générer des environnements virtuels issus d'images de rue réelles, et non uniquement de données synthétiques.
Comment fonctionne l'intégration
Project Genie est le cadre de DeepMind pour construire des mondes 3D interactifs à partir d'un mélange de photos, vidéos et textes. En alimentant le système avec l'immense archive de photos géolocalisées de Street View — des millions d'images capturant des paysages urbains dans plus de 100 pays — celui-ci peut reconstruire ces lieux sous forme d'espaces numériques navigables. Le résultat est une simulation qui reflète l'apparence et la disposition des lieux réels, des devantures de magasins aux intersections.
Pourquoi les données de Street View sont importantes
Street View offre un flux constant d'images étiquetées et spécifiques à un lieu, collectées au fil des ans. Cette variété aide les modèles de Genie à apprendre à quoi ressemblent réellement différentes villes, climats et styles architecturaux, plutôt que de se baser sur des éléments idéalisés ou fictifs. Pour l'entraînement de l'IA, cela signifie que les agents peuvent s'exercer à des tâches comme la navigation ou la reconnaissance d'objets dans des environnements qui se comportent comme le monde physique.
Ce que cela pourrait signifier pour la recherche en IA
Les simulations construites à partir de données réelles permettent aux chercheurs de tester des systèmes autonomes dans des conditions difficiles à reproduire artificiellement — pensez aux marquages routiers usés, aux lignes électriques emmêlées ou aux changements de lumière. Cette technologie pourrait également soutenir des outils de planification urbaine, des exercices de gestion de catastrophes, ou même le tourisme virtuel. Mais DeepMind n'a pas détaillé d'applications spécifiques au-delà de la phase de recherche.
Un effet immédiat : cette initiative relie plus étroitement les données géospatiales à l'IA générative. Google possède à la fois Street View et DeepMind, donc cette intégration reste au sein de l'entreprise. Cela pourrait accélérer les projets internes, mais soulève également des questions sur la manière dont les simulations résultantes pourraient être partagées ou sous licence.
La vie privée est un autre problème non résolu. Street View a été critiqué pour avoir capturé des visages, des plaques d'immatriculation et des propriétés privées dans ses images. L'utilisation de ces données pour construire des simulations — qui pourraient être rejouées ou exportées — ravive ces préoccupations, surtout si les mondes générés conservent des détails identifiables.
Google DeepMind n'a pas fixé de date pour la publication du système intégré aux développeurs ou chercheurs externes. Pour l'instant, le travail reste à huis clos.
