آنتروپیک روز سهشنبه از کلود فیبل ۵ رونمایی کرد، جدیدترین مدل هوش مصنوعی عمومی خود و قدرتمندترین سیستمی که تاکنون به صورت عمومی عرضه کرده است. به گفته تستهای داخلی، این مدل از کلاس میتوس در بنچمارکهای کدنویسی، مالی و بینایی از رقبا پیشی میگیرد. قیمتگذاری آن کمتر از نصف هزینه کلود میتوس پیشنمای خود آنتروپیک است، اقدامی که میتواند بازار شلوغ مدلهای زبانی بزرگ را متزلزل کند.
قابلیتهای کلود فیبل ۵
فیبل ۵ بر پایه معماری میتوس ساخته شده است، همان خانوادهای که میتوس پیشنما نیز از آن بود. اما آنتروپیک میگوید این نسخه عملکرد را در چندین حوزه کلیدی فراتر برده است. این شرکت گزارش داد که در وظایف کدنویسی از مدلهای مشابه OpenAI، گوگل و متا پیشی میگیرد. همچنین بنچمارکهای تحلیل مالی برتری را نشان میدهند و وظایف مبتنی بر بینایی - مانند تفسیر نمودارها و تصاویر - امتیاز بالاتری نسبت به نسخههای قبلی آنتروپیک و سیستمهای رقیب کسب میکنند.
این مدل از روز سهشنبه از طریق API آنتروپیک و ربات چت مصرفکننده آن، کلود، در دسترس است. کاربران میتوانند بلافاصله به آن دسترسی داشته باشند، اگرچه این شرکت محدودیت استفاده یا نرخ مشخصی برای عرضه اعلام نکرده است.
تغییر قیمت معادلات را عوض میکند
برجستهترین نکته در اعلامیه روز سهشنبه قیمت است. هزینه کلود فیبل ۵ کمتر از نصف هزینه کلود میتوس پیشنما به ازای هر توکن است. آنتروپیک ارقام دقیق هر توکن را در مواد عرضه منتشر نکرده است، اما این تخفیف به اندازهای قابل توجه است که شرکت آن را یک مزیت استراتژیک معرفی کرده است. برای توسعهدهندگان و کسبوکارهایی که حجم زیادی از پرسوجوها را اجرا میکنند، صرفهجویی میتواند قابل توجه باشد.
قیمت پایینتر همچنین به رقبا فشار میآورد. GPT-4o OpenAI و Gemini 1.5 Pro گوگل هزینههای مشابهی به ازای هر توکن با میتوس پیشنمای قدیمی دارند، به این معنی که فیبل ۵ از نظر قیمت از آنها پایینتر است و در عین حال در برخی بنچمارکها ادعای عملکرد برتر دارد. اینکه آیا بارهای کاری واقعی با تستهای داخلی مطابقت دارند یا نه هنوز مشخص نیست، اما صرف قیمتگذاری احتمالاً توجه خریداران سازمانی را جلب خواهد کرد.
ادعاهای بنچمارک در مقابل رقابت واقعی
آنتروپیک مقایسههایی در سه دسته بنچمارک ارائه کرده است: کدنویسی (با استفاده از HumanEval، SWE-bench و ارزیابیهای داخلی)، مالی (ترکیبی از استدلال مالی و وظایف خلاصهسازی) و بینایی (شرح تصویر و پرسش و پاسخ بصری). به گفته دادههای آنتروپیک، در هر کدام، فیبل ۵ امتیاز بالاتری نسبت به GPT-4o، Gemini 1.5 Pro و Llama 3.1 405B متا کسب کرده است.
تأیید مستقل هنوز منتشر نشده است. نتایج بنچمارک از شرکتی که مدل را میسازد در صنعت استاندارد است، اما ممیزیهای شخص ثالث - مانند آنهایی که توسط HELM استنفورد یا LMSYS Chatbot Arena اجرا میشوند - اغلب برای توسعهدهندگان بدبین وزن بیشتری دارند. آنتروپیک نگفته است که چه زمانی یا آیا فیبل ۵ را به آن ارزیابیها ارائه خواهد داد یا خیر.
این مدل همچنین از ورودیهای چندوجهی پشتیبانی میکند، به این معنی که کاربران میتوانند تصاویر را همراه با متن آپلود کنند. این ویژگی در عرضه میتوس پیشنما که فقط متنی بود در دسترس نبود. آنتروپیک میگوید عملکرد بینایی در فیبل ۵ از مدلهای بینایی اختصاصی آزمایشگاههای دیگر در وظایف آزمایش شده فراتر است.
مرحله بعدی
آنتروپیک جدول زمانی برای جایگزینی رده قدیمی میتوس پیشنما اعلام نکرده است. در حال حاضر هر دو مدل در دسترس باقی میمانند، اما شکاف قیمتی زیاد و پیشرفتهای عملکردی، فیبل ۵ را به گزینه آشکار برای پروژههای جدید تبدیل میکند. کاربران فعلی میتوس پیشنما ممکن است بخواهند فیبل ۵ را آزمایش کرده و نتایج را قبل از مهاجرت بارهای کاری تولیدی مقایسه کنند.
این عرضه همزمان با ورود مسابقه تسلیحاتی هوش مصنوعی به مرحله جدیدی است - نه فقط در مورد توانایی خام، بلکه در مورد مقرونبهصرفه بودن در مقیاس. شرط آنتروپیک این است که یک مدل ارزانتر و قویتر مشتریانی را جذب کند که از قیمتگذاری قبلی خودداری کرده بودند. اینکه آیا این شرط جواب میدهد بستگی به عملکرد فیبل ۵ در خارج از آزمایشگاه، در دنیای نامرتب و غیرقابل پیشبینی برنامههای واقعی دارد.




