آنتروپیک کلود فیبل ۵ را عرضه کرد؛ ادعای عملکرد برتر با نصف قیمت مدل قبلی

آنتروپیک روز سه‌شنبه از کلود فیبل ۵ رونمایی کرد، جدیدترین مدل هوش مصنوعی عمومی خود و قدرتمندترین سیستمی که تاکنون به صورت عمومی عرضه کرده است. به گفته تست‌های داخلی، این مدل از کلاس میتوس در بنچمارک‌های کدنویسی، مالی و بینایی از رقبا پیشی می‌گیرد. قیمت‌گذاری آن کمتر از نصف هزینه کلود میتوس پیش‌نمای خود آنتروپیک است، اقدامی که می‌تواند بازار شلوغ مدل‌های زبانی بزرگ را متزلزل کند.

قابلیت‌های کلود فیبل ۵

فیبل ۵ بر پایه معماری میتوس ساخته شده است، همان خانواده‌ای که میتوس پیش‌نما نیز از آن بود. اما آنتروپیک می‌گوید این نسخه عملکرد را در چندین حوزه کلیدی فراتر برده است. این شرکت گزارش داد که در وظایف کدنویسی از مدل‌های مشابه OpenAI، گوگل و متا پیشی می‌گیرد. همچنین بنچمارک‌های تحلیل مالی برتری را نشان می‌دهند و وظایف مبتنی بر بینایی - مانند تفسیر نمودارها و تصاویر - امتیاز بالاتری نسبت به نسخه‌های قبلی آنتروپیک و سیستم‌های رقیب کسب می‌کنند.

این مدل از روز سه‌شنبه از طریق API آنتروپیک و ربات چت مصرف‌کننده آن، کلود، در دسترس است. کاربران می‌توانند بلافاصله به آن دسترسی داشته باشند، اگرچه این شرکت محدودیت استفاده یا نرخ مشخصی برای عرضه اعلام نکرده است.

تغییر قیمت معادلات را عوض می‌کند

برجسته‌ترین نکته در اعلامیه روز سه‌شنبه قیمت است. هزینه کلود فیبل ۵ کمتر از نصف هزینه کلود میتوس پیش‌نما به ازای هر توکن است. آنتروپیک ارقام دقیق هر توکن را در مواد عرضه منتشر نکرده است، اما این تخفیف به اندازه‌ای قابل توجه است که شرکت آن را یک مزیت استراتژیک معرفی کرده است. برای توسعه‌دهندگان و کسب‌وکارهایی که حجم زیادی از پرس‌وجوها را اجرا می‌کنند، صرفه‌جویی می‌تواند قابل توجه باشد.

قیمت پایین‌تر همچنین به رقبا فشار می‌آورد. GPT-4o OpenAI و Gemini 1.5 Pro گوگل هزینه‌های مشابهی به ازای هر توکن با میتوس پیش‌نمای قدیمی دارند، به این معنی که فیبل ۵ از نظر قیمت از آنها پایین‌تر است و در عین حال در برخی بنچمارک‌ها ادعای عملکرد برتر دارد. اینکه آیا بارهای کاری واقعی با تست‌های داخلی مطابقت دارند یا نه هنوز مشخص نیست، اما صرف قیمت‌گذاری احتمالاً توجه خریداران سازمانی را جلب خواهد کرد.

ادعاهای بنچمارک در مقابل رقابت واقعی

آنتروپیک مقایسه‌هایی در سه دسته بنچمارک ارائه کرده است: کدنویسی (با استفاده از HumanEval، SWE-bench و ارزیابی‌های داخلی)، مالی (ترکیبی از استدلال مالی و وظایف خلاصه‌سازی) و بینایی (شرح تصویر و پرسش و پاسخ بصری). به گفته داده‌های آنتروپیک، در هر کدام، فیبل ۵ امتیاز بالاتری نسبت به GPT-4o، Gemini 1.5 Pro و Llama 3.1 405B متا کسب کرده است.

تأیید مستقل هنوز منتشر نشده است. نتایج بنچمارک از شرکتی که مدل را می‌سازد در صنعت استاندارد است، اما ممیزی‌های شخص ثالث - مانند آنهایی که توسط HELM استنفورد یا LMSYS Chatbot Arena اجرا می‌شوند - اغلب برای توسعه‌دهندگان بدبین وزن بیشتری دارند. آنتروپیک نگفته است که چه زمانی یا آیا فیبل ۵ را به آن ارزیابی‌ها ارائه خواهد داد یا خیر.

این مدل همچنین از ورودی‌های چندوجهی پشتیبانی می‌کند، به این معنی که کاربران می‌توانند تصاویر را همراه با متن آپلود کنند. این ویژگی در عرضه میتوس پیش‌نما که فقط متنی بود در دسترس نبود. آنتروپیک می‌گوید عملکرد بینایی در فیبل ۵ از مدل‌های بینایی اختصاصی آزمایشگاه‌های دیگر در وظایف آزمایش شده فراتر است.

مرحله بعدی

آنتروپیک جدول زمانی برای جایگزینی رده قدیمی میتوس پیش‌نما اعلام نکرده است. در حال حاضر هر دو مدل در دسترس باقی می‌مانند، اما شکاف قیمتی زیاد و پیشرفت‌های عملکردی، فیبل ۵ را به گزینه آشکار برای پروژه‌های جدید تبدیل می‌کند. کاربران فعلی میتوس پیش‌نما ممکن است بخواهند فیبل ۵ را آزمایش کرده و نتایج را قبل از مهاجرت بارهای کاری تولیدی مقایسه کنند.

این عرضه همزمان با ورود مسابقه تسلیحاتی هوش مصنوعی به مرحله جدیدی است - نه فقط در مورد توانایی خام، بلکه در مورد مقرون‌به‌صرفه بودن در مقیاس. شرط آنتروپیک این است که یک مدل ارزان‌تر و قوی‌تر مشتریانی را جذب کند که از قیمت‌گذاری قبلی خودداری کرده بودند. اینکه آیا این شرط جواب می‌دهد بستگی به عملکرد فیبل ۵ در خارج از آزمایشگاه، در دنیای نامرتب و غیرقابل پیش‌بینی برنامه‌های واقعی دارد.

قابلیت‌های کلود فیبل ۵

تغییر قیمت معادلات را عوض می‌کند

ادعاهای بنچمارک در مقابل رقابت واقعی

مرحله بعدی

Related Articles