فی-فی لی، محقق باتجربه در حوزه هوش مصنوعی، چارچوب جدیدی برای مدلهای جهان ارائه کرده است که هدف آن دادن درک عمیقتری از فضای فیزیکی به ماشینهاست. اگر این پیشنهاد به نتیجه برسد، میتواند به رباتها امکان دهد تا محیط اطراف خود را با سطحی از درک که هوش مصنوعی فعلی عمدتاً فاقد آن است، پیمایش و دستکاری کنند.
چرا مدلهای جهان اهمیت دارند
بیشتر سیستمهای هوش مصنوعی امروزی جهان را بهصورت تصاویر مسطح یا دادههای انتزاعی میبینند. آنها واقعاً درک نمیکنند که یک صندلی چیزی است که روی آن مینشینید، یک دیوار قابل عبور نیست، یا یک فنجان اگر از روی میز هل داده شود، سقوط میکند. چارچوب لی سعی دارد این مشکل را با ساختن چیزی که او مدل جهان مینامد - یک بازنمایی داخلی از محیط که شامل هندسه، فیزیک و روابط بین اشیا است - برطرف کند.
این نوع هوش مکانی برای رباتهایی که باید در خانهها، انبارها یا بیمارستانها کار کنند، بسیار حیاتی است. یک جاروبرقی که گوشهها را درک نمیکند، به آنها برخورد میکند. یک پهپاد تحویلدهنده که نمیتواند باد را پیشبینی کند، ممکن است یک بسته را بیندازد. رویکرد لی قول میدهد با اجازه دادن به هوش مصنوعی برای شبیهسازی اقدامات احتمالی قبل از انجام آنها، از این محدودیتها فراتر رود.
از شبیهسازی تا واقعیت
چارچوب فقط درباره نقشههای بهتر نیست. بلکه درباره یادگیری نحوه رفتار جهان است. مدل سناریوهای فرضی را اجرا میکند - اگر ربات یک جعبه را هل دهد چه اتفاقی میافتد، یا اگر فردی در مقابل آن راه برود - و درک خود را بر اساس آنچه واقعاً رخ میدهد بهروزرسانی میکند. این حلقه بازخورد میتواند رباتها را سازگارتر و ایمنتر کند.
لی سالهاست روی هوش مکانی کار میکند. تحقیقات قبلی او در زمینه تشخیص تصویر به آموزش کامپیوترها برای شناسایی اشیا کمک کرد. این تلاش جدید یک قدم فراتر میرود: نه فقط دیدن، بلکه استدلال درباره فضا. مدل جهان مانند یک نوع موتور فیزیک داخلی عمل میکند و به هوش مصنوعی اجازه میدهد نتایج را بدون نیاز به امتحان هر اقدام در دنیای واقعی پیشبینی کند.
چالشهای پیش رو
ساختن یک مدل جهان قابل اعتماد سخت است. محیطهای واقعی بههمریخته هستند. نور تغییر میکند، اشیا جابهجا میشوند، افراد غیرقابلپیشبینی رفتار میکنند. چارچوب لی باید بتواند این آشفتگی را بدون از کار افتادن مدیریت کند. هزینه محاسباتی نیز سنگین است - اجرای شبیهسازیهای دقیق برای هر تصمیم نیاز به قدرت پردازش بالایی دارد.
محقق هنوز نتایج یک آزمایش در مقیاس بزرگ را منتشر نکرده است. این چارچوب در یک مقاله اخیر توضیح داده شده است، اما آزمایش واقعی این خواهد بود که آیا در خارج از آزمایشگاه کار میکند یا خیر. رباتی که بتواند یک مدل جهان را در لحظه بسازد و استفاده کند، گام بزرگی نسبت به سیستمهای امروزی خواهد بود که عمدتاً به قوانین از پیش برنامهریزیشده یا مجموعه دادههای عظیم از نمونههای برچسبگذاریشده متکی هستند.
آزمایشگاههای دیگر نیز در جهتهای مشابهی حرکت میکنند. دیپمایند، اوپنایآی و چند گروه دانشگاهی همگی ایدههای مدل جهان را مطرح کردهاند. نسخه لی بهخاطر تمرکز بر استدلال مکانی - نوع درکی که یک انسان برای عبور از یک اتاق شلوغ بدون برخورد با کسی استفاده میکند - برجسته است.
اینکه آیا این چارچوب میتواند فراتر از شبیهسازیها به محیطهای پویا و بههمریخته مقیاسپذیر باشد، یک سوال باز است. تیم لی به احتمال زیاد هماکنون روی آن کار میکند، اما هیچ جدول زمانی برای یک نمونه اولیه عملیاتی ارائه نشده است.




