Fei-Fei Li | GFdaily

etc. I'll write Bengali in a natural journalistic style. Meta description: "Researcher Fei-Fei Li proposes a new framework for AI world models that could give robots a deep understanding of physical space and reshape interaction with real environments." Translate: "গবেষক ফেই-ফেই লি এআই ওয়ার্ল্ড মডেলের জন্য একটি নতুন কাঠামো প্রস্তাব করেছেন যা রোবটগুলিকে ভৌত স্থানের গভীর উপলব্ধি দিতে পারে এবং বাস্তব পরিবেশের সাথে মিথস্ক্রিয়াকে পুনরায় রূপ দিতে পারে।" Now full translation: Title: "ফেই-ফেই লি-র ওয়ার্ল্ড মডেল ফ্রেমওয়ার্ক এআই-এর স্থানিক অন্ধ দাগকে লক্ষ্য করছে" Content:

ফেই-ফেই লি, কৃত্রিম বুদ্ধিমত্তার একজন অভিজ্ঞ গবেষক, ওয়ার্ল্ড মডেলের জন্য একটি নতুন কাঠামো উন্মোচন করেছেন যার লক্ষ্য মেশিনগুলিকে ভৌত স্থানের আরও গভীর উপলব্ধি দেওয়া। এই প্রস্তাব সফল হলে, রোবটগুলি বর্তমান এআই-য়ের অভাব থাকা এক স্তরের বোঝাপড়ার সাথে তাদের চারপাশ নেভিগেট এবং পরিচালনা করতে সক্ষম হতে পারে।

ওয়ার্ল্ড মডেল কেন গুরুত্বপূর্ণ

আজকের বেশিরভাগ এআই সিস্টেম বিশ্বকে ফ্ল্যাট ছবি বা বিমূর্ত ডেটা হিসেবে দেখে। তারা আসলে বোঝে না যে একটি চেয়ার এমন কিছু যার উপর বসা হয়, একটি দেয়াল দিয়ে হাঁটা যায় না, বা একটি কাপ টেবিল থেকে ধাক্কা দিলে পড়ে যাবে। লি-র কাঠামো এটি ঠিক করার চেষ্টা করে যা তিনি ওয়ার্ল্ড মডেল নামে অভিহিত করেন — পরিবেশের একটি অভ্যন্তরীণ উপস্থাপনা যা জ্যামিতি, পদার্থবিদ্যা এবং বস্তুর মধ্যে সম্পর্ক অন্তর্ভুক্ত করে।

এই ধরনের স্থানিক বুদ্ধিমত্তা রোবটের জন্য অত্যন্ত গুরুত্বপূর্ণ যেগুলিকে বাড়ি, গুদাম বা হাসপাতালে কাজ করতে হবে। একটি ভ্যাকুয়াম ক্লিনার যে কোণগুলি বোঝে না সেগুলিতে ধাক্কা খায়। একটি ডেলিভারি ড্রোন যে বাতাসের পূর্বাভাস দিতে পারে না সে প্যাকেজ ফেলে দিতে পারে। লি-র পদ্ধতি এআই-কে সম্ভাব্য কর্মকাণ্ড অনুকরণ করতে দিয়ে এই সীমা অতিক্রম করার প্রতিশ্রুতি দেয়।

সিমুলেশন থেকে বাস্তবে

কাঠামোটি শুধুমাত্র উন্নত মানচিত্র নয়। এটি বিশ্ব কীভাবে আচরণ করে তা শেখার বিষয়ে। মডেলটি অনুমানমূলক পরিস্থিতি চালাবে — যদি রোবট একটি বাক্স ঠেলে দেয়, বা যদি একজন ব্যক্তি তার সামনে হেঁটে যায় তাহলে কী হয় — এবং প্রকৃত কী ঘটে তার উপর ভিত্তি করে তার বোঝাপড়া আপডেট করবে। সেই ফিডব্যাক লুপ রোবটগুলিকে আরও অভিযোজিত এবং নিরাপদ করে তুলতে পারে।

লি বছর ধরে স্থানিক বুদ্ধিমত্তা নিয়ে কাজ করছেন। তার পূর্ববর্তী গবেষণা চিত্র শনাক্তকরণে কম্পিউটারকে বস্তু চিহ্নিত করতে প্রশিক্ষণ দিতে সহায়তা করেছিল। এই নতুন প্রচেষ্টা আরও এক ধাপ এগিয়ে: শুধু দেখা নয়, বরং স্থান নিয়ে যুক্তি করা। ওয়ার্ল্ড মডেলটি এক ধরনের অভ্যন্তরীণ পদার্থবিজ্ঞান ইঞ্জিনের মতো কাজ করে, যা এআই-কে বাস্তব জগতে প্রতিটি কাজ চেষ্টা না করেই ফলাফল পূর্বাভাস করতে দেয়।

সামনে চ্যালেঞ্জ

একটি নির্ভরযোগ্য ওয়ার্ল্ড মডেল তৈরি করা কঠিন। বাস্তব পরিবেশগুলি বিশৃঙ্খল। আলো পরিবর্তিত হয়, বস্তু নড়াচড়া করে, মানুষ অপ্রত্যাশিতভাবে আচরণ করে। লি-র কাঠামোকে সেই বিশৃঙ্খলা ভেঙে না পড়ে সামলাতে হবে। গণনামূলক খরচও বেশি — প্রতিটি সিদ্ধান্তের জন্য বিস্তারিত সিমুলেশন চালানো গুরুতর প্রক্রিয়াকরণ শক্তির প্রয়োজন।

গবেষক এখনও একটি বড় আকারের পরীক্ষা থেকে ফলাফল প্রকাশ করেননি। কাঠামোটি একটি সাম্প্রতিক গবেষণাপত্রে বর্ণিত হয়েছে, তবে প্রকৃত পরীক্ষা হবে এটি ল্যাবের বাইরে কাজ করে কিনা। একটি রোবট যে উড়তে উড়তে একটি ওয়ার্ল্ড মডেল তৈরি এবং ব্যবহার করতে পারে তা আজকের সিস্টেমগুলির তুলনায় একটি বড় লাফ হবে, যা বেশিরভাগ ক্ষেত্রে প্রাক-প্রোগ্রাম করা নিয়ম বা লেবেলযুক্ত উদাহরণের বিশাল ডেটাসেটের উপর নির্ভর করে।

অন্যান্য ল্যাবরেটরিও অনুরূপ দিকে এগোচ্ছে। ডিপমাইন্ড, ওপেনএআই এবং কিছু বিশ্ববিদ্যালয় গ্রুপ সবাই ওয়ার্ল্ড মডেল ধারণা প্রস্তাব করেছে। লি-র সংস্করণটি স্থানিক যুক্তির উপর তার ফোকাসের জন্য আলাদা — যে ধরনের বোঝাপড়া একজন মানুষ জনাকীর্ণ ঘরের মধ্যে কারও সাথে ধাক্কা না খেয়ে হাঁটতে ব্যবহার করে।

কাঠামোটি সিমুলেশন ছাড়িয়ে বিশৃঙ্খল, গতিশীল পরিবেশে স্কেল করতে পারে কিনা তা একটি উন্মুক্ত প্রশ্ন। লি-র দল সম্ভবত এখন এটিতে কাজ করছে, তবে একটি কাজের প্রোটোটাইপের জন্য কোনো সময়রেখা দেওয়া হয়নি।

ওয়ার্ল্ড মডেল কেন গুরুত্বপূর্ণ

সিমুলেশন থেকে বাস্তবে

সামনে চ্যালেঞ্জ

Related Articles