Anthropic запускає Claude Fable 5, заявляючи про найвищу продуктивність за половину ціни попередньої моделі

Що пропонує Claude Fable 5

Fable 5 побудована на архітектурі Mythos, тієї ж родини, що й попередня Mythos Preview. Але Anthropic стверджує, що ця версія ще більше підвищує продуктивність у кількох ключових сферах. За даними компанії, у завданнях з програмування вона перевершує аналогічні моделі від OpenAI, Google та Meta. Бенчмарки фінансового аналізу також показують лідерство, а візуальні завдання — як-от інтерпретація діаграм і графіків — отримують вищі оцінки, ніж попередні випуски Anthropic та конкуруючі системи.

Модель стає доступною з вівторка через API Anthropic та їхній споживчий чат-бот Claude. Користувачі можуть отримати до неї негайний доступ, хоча компанія не розкрила конкретних обмежень використання чи лімітів швидкості на момент запуску.

Зниження ціни змінює розкладки

Найбільш вражаючою деталлю вівторкового анонсу є ціна. Claude Fable 5 коштує менш ніж половину того, що Claude Mythos Preview бере за токен. Anthropic не оприлюднив точні показники за токен у матеріалах запуску, але знижка є достатньо значною, щоб компанія представила її як стратегічну перевагу. Для розробників і бізнесів, які виконують великі обсяги запитів, економія може бути суттєвою.

Нижча ціна також створює тиск на конкурентів. OpenAI GPT-4o та Google Gemini 1.5 Pro мають подібну вартість за токен до старішої Mythos Preview, тож Fable 5 перевершує їх за ціною, одночасно претендуючи на вищу продуктивність за певними бенчмарками. Чи відповідають реальні робочі навантаження внутрішнім тестам — покаже час, але саме ціноутворення, ймовірно, приверне увагу корпоративних покупців.

Заяви про бенчмарки проти реальної конкуренції

Anthropic надав порівняння за трьома категоріями бенчмарків: програмування (з використанням HumanEval, SWE-bench та внутрішніх оцінок), фінанси (суміш завдань фінансового міркування та узагальнення) та візуальні задачі (підписування зображень та візуальні запитання-відповіді). За даними Anthropic, у кожній з них Fable 5 отримав вищі бали, ніж GPT-4o, Gemini 1.5 Pro та Meta Llama 3.1 405B.

Незалежної перевірки поки що не опубліковано. Результати бенчмарків від компанії, яка створює модель, є стандартними в індустрії, але сторонні аудити — як-от ті, що проводять Stanford HELM або LMSYS Chatbot Arena — часто мають більшу вагу для скептично налаштованих розробників. Anthropic не повідомив, коли або чи взагалі подасть Fable 5 на такі оцінки.

Модель також підтримує мультимодальні входи, тобто користувачі можуть завантажувати зображення разом із текстом. Ця функція була недоступна у випуску Mythos Preview, який був лише текстовим. Anthropic стверджує, що візуальна продуктивність Fable 5 перевищує продуктивність спеціалізованих візуальних моделей від інших лабораторій у протестованих завданнях.

Що далі

Anthropic не оголосив термінів заміни старішої версії Mythos Preview. Наразі обидві моделі залишаються доступними, але значний розрив у ціні та приріст продуктивності роблять Fable 5 очевидним вибором для нових проєктів. Існуючі користувачі Mythos Preview можуть захотіти протестувати Fable 5 та порівняти результати перед міграцією робочих навантажень.

Запуск відбувається в той час, коли гонка ШІ входить у нову фазу — не лише про сиру потужність, але й про доступність у масштабі. Ставка Anthropic полягає в тому, що дешевша та сильніша модель привабить клієнтів, які раніше відмовлялися через попередні ціни. Чи виправдається ця ставка, залежить від того, як Fable 5 працюватиме за межами лабораторії

Що пропонує Claude Fable 5

Зниження ціни змінює розкладки

Заяви про бенчмарки проти реальної конкуренції

Що далі

Related Articles