AutoTTS LLM-এর যুক্তি কার্যে টোকেন ব্যবহার ৬৯.৫% হ্রাস করেছে

AutoTTS নামক একটি নতুন কৌশল LLM-এর যুক্তি কৌশলগুলিতে টোকেন ব্যবহার ৬৯.৫% হ্রাস করার দাবি করছে। পদ্ধতিটি, একটি নামহীন দল তৈরি করেছে, LLM-গুলি কীভাবে জটিল যুক্তিকে ধাপে ভাঙে তার মূল অদক্ষতাকে লক্ষ্য করে — এবং এটি অন্তর্নিহিত মডেল আর্কিটেকচারে কোনো পরিবর্তন ছাড়াই করে।

AutoTTS-এর ভিন্নতা

AutoTTS মানে Automatic Token Truncation Strategy (স্বয়ংক্রিয় টোকেন সংক্ষেপণ কৌশল)। এই পদ্ধতি LLM-গুলি বহু-ধাপ সমস্যা সমাধানের সময় যে চেইন-অফ-থট যুক্তি ক্রম তৈরি করে তা সংক্ষিপ্ত করে। ভার্বোস মধ্যবর্তী ধাপ তৈরি করার পরিবর্তে, AutoTTS যৌক্তিক প্রবাহ বজায় রেখে অপ্রয়োজনীয় টোকেন ছেঁটে ফেলে। ফলাফল: প্রতি কুয়েরিতে মডেলের মাধ্যমে কম ডেটা পাঠানো হয়।

৬৯.৫% এই সংখ্যাটি বিভিন্ন যুক্তি বেঞ্চমার্ক জুড়ে অভ্যন্তরীণ পরীক্ষা থেকে এসেছে। দলটি ব্যবহৃত সঠিক বেঞ্চমার্ক বা কৌশলটি কোনো নির্দিষ্ট মডেল সাইজ বা পরিবারে প্রয়োগ করা হয়েছে কিনা তা প্রকাশ করেনি।

টোকেন সংখ্যা কেন গুরুত্বপূর্ণ

LLM-এর প্রক্রিয়াকৃত প্রতিটি টোকেনের জন্য অর্থ এবং সময় খরচ হয়। যেসব ব্যবসা স্কেলে ইনফারেন্স চালায়, তাদের জন্য টোকেন ব্যবহারে সামান্য হ্রাসও ক্লাউড বিল কমাতে পারে। প্রায় ৭০% কমে যাওয়ার অর্থ হল প্রতি ডলার কম্পিউট খরচে প্রায় তিনগুণ বেশি আউটপুট। লেটেন্সিও কমে, কারণ ছোট ক্রম একই হার্ডওয়্যারে দ্রুত শেষ হয়।

AI-চালিত টুলের ডেভেলপাররা টোকেন অর্থনীতি সম্পর্কে ভালোভাবে সচেতন। যুক্তির গুণমান বিসর্জন না দিয়ে টোকেন ওভারহেড কমানো একটি বড় ইঞ্জিনিয়ারিং লক্ষ্য ছিল। যদি AutoTTS দাবি অনুযায়ী কাজ করে, তাহলে এটি কোম্পানিগুলি কীভাবে তাদের LLM পাইপলাইন অপ্টিমাইজ করে তা পরিবর্তন করতে পারে।

অবশিষ্ট প্রশ্নগুলি

বড় অজানা বিষয় হলো নির্ভুলতা। তথ্যগুলি কেবল টোকেন হ্রাসের সংখ্যা উল্লেখ করে। দলটি ফলাফল প্রকাশ করেনি যে সংক্ষিপ্ত যুক্তি শৃঙ্খলগুলি পূর্ণ সংস্করণের মতো একই চূড়ান্ত উত্তর দেয় কিনা। অতীতে চেইন-অফ-থট সংকুচিত করার প্রচেষ্টা কখনও কখনও যৌক্তিক ফাঁক বা ভুল সিদ্ধান্তে নিয়ে গেছে।

আরেকটি উন্মুক্ত প্রশ্ন হলো সাধারণীকরণযোগ্যতা। AutoTTS কি বিভিন্ন মডেল আর্কিটেকচার জুড়ে কাজ করে — ওপেন-ওয়েট মডেল থেকে মালিকানাধীন মডেল পর্যন্ত? দলটি পরীক্ষিত মডেল বা সবচেয়ে বেশি উপকৃত যুক্তি কাজের ধরন সম্পর্কে বিস্তারিত জানায়নি। সেই ডেটা ছাড়া, কৌশলটিকে প্লাগ-এন্ড-প্লে সমাধান বলা খুব তাড়াতাড়ি।

যেসব গবেষক ফলাফল পুনরুত্পাদন করতে চান তাদের সম্পূর্ণ পদ্ধতি প্রয়োজন। দলটি কখন বা তারা একটি পেপার প্রকাশ বা কোড প্রকাশ করার পরিকল্পনা করে কিনা তা জানায়নি। ততক্ষণ পর্যন্ত, ৬৯.৫% হ্রাস একটি আকর্ষণীয় দাবি থেকে যাচ্ছে যা বিস্তৃত বৈধতার অপেক্ষায় রয়েছে।

AutoTTS-এর ভিন্নতা

টোকেন সংখ্যা কেন গুরুত্বপূর্ণ

অবশিষ্ট প্রশ্নগুলি

Related Articles