Рамкова модель світу Фей-Фей Лі націлена на просторову сліпоту ШІ

Фей-Фей Лі, досвідчена дослідниця у сфері штучного інтелекту, запропонувала нову рамкову модель для світових моделей, спрямовану на те, щоб надати машинам значно глибше розуміння фізичного простору. Якщо ця пропозиція спрацює, вона може дозволити роботам орієнтуватися та маніпулювати навколишнім середовищем на рівні розуміння, якого нинішньому ШІ значно бракує.

Чому світові моделі важливі

Більшість сучасних систем ШІ бачать світ як пласкі зображення або абстрактні дані. Вони не розуміють, що стілець призначений для сидіння, що крізь стіну не можна пройти, або що чашка впаде, якщо її зіштовхнути зі столу. Рамкова модель Лі намагається виправити це шляхом побудови того, що вона називає світовою моделлю — внутрішнього представлення середовища, яке включає геометрію, фізику та взаємозв'язки між об'єктами.

Такий просторовий інтелект є критично важливим для роботів, які мають працювати вдома, на складах чи в лікарнях. Пилосос, який не розуміє кутів, натикатиметься на них. Доставний дрон, який не може передбачити вітер, може впустити пакунок. Підхід Лі обіцяє подолати ці обмеження, дозволяючи ШІ імітувати можливі дії, перш ніж їх виконувати.

Від симуляції до реальності

Рамкова модель — це не просто про кращі карти. Йдеться про вивчення того, як поводиться світ. Модель перебиратиме гіпотетичні сценарії — що станеться, якщо робот штовхне коробку, або якщо людина пройде перед ним — і оновлюватиме своє розуміння на основі того, що відбувається насправді. Такий зворотній зв'язок може зробити роботів більш адаптивними та безпечнішими.

Лі працює над просторовим інтелектом роками. Її попередні дослідження розпізнавання зображень допомогли навчити комп'ютери ідентифікувати об'єкти. Це нове зусилля робить крок далі: не просто бачити, а міркувати про простір. Світова модель діє як свого роду внутрішній фізичний рушій, дозволяючи ШІ передбачати результати, не випробовуючи кожну дію в реальному світі.

Майбутні виклики

Побудувати надійну світову модель важко. Реальне середовище є хаотичним. Освітлення змінюється, об'єкти рухаються, люди поводяться непередбачувано. Рамкова модель Лі має впоратися з цим хаосом без збоїв. Обчислювальна вартість також висока — запуск детальних симуляцій для кожного рішення потребує серйозної обчислювальної потужності.

Дослідниця ще не опублікувала результати масштабного тесту. Рамкова модель описана в нещодавній статті, але справжнім випробуванням буде те, чи працюватиме вона за межами лабораторії. Робот, який здатен побудувати та використовувати світову модель "на льоту", представляв би великий стрибок у порівнянні з сьогоднішніми системами, які в основному покладаються на заздалегідь запрограмовані правила або величезні набори даних з позначеними прикладами.

Інші лабораторії рухаються в подібних напрямках. DeepMind, OpenAI та кілька університетських груп також запропонували ідеї світових моделей. Версія Лі вирізняється своїм фокусом на просторовому мисленні — тому типі розуміння, яке людина використовує, щоб пройти через переповнену кімнату, нікого не зачепивши.

Чи зможе рамкова модель масштабуватися за межі симуляцій у хаотичне динамічне середовище — залишається відкритим питанням. Команда Лі, ймовірно, зараз працює над цим, але жодних термінів для робочого прототипу не оголошено.

Чому світові моделі важливі

Від симуляції до реальності

Майбутні виклики

Related Articles