Компания Anyscale выпустила новый инструмент, предназначенный для оптимизации этапа пост-обучения больших языковых моделей, автоматизируя такие задачи, как выбор методологии, планирование GPU и генерацию конфигураций. По заявлению компании, инструмент призван упростить то, что стало сложной и ресурсоемкой частью развертывания LLM в производственной среде.
Что автоматизирует инструмент
Инструмент ориентирован на процесс тонкой настройки, который обычно требует от инженеров ручного выбора между подходами, такими как полная тонкая настройка, LoRA или QLoRA, а затем определения правильной конфигурации GPU и гиперпараметров. Система Anyscale берет на себя эти решения, генерируя конфигурацию, соответствующую модели и аппаратным ограничениям пользователя. Компания утверждает, что это позволяет сократить время, затрачиваемое на метод проб и ошибок, и снизить риск неправильно настроенных запусков.
Почему пост-обучение важно сейчас
По мере того как организации переходят от экспериментов с LLM к фактическому развертыванию, тонкая настройка становится узким местом. Готовые модели часто требуют доработки для конкретных областей или задач, но этот процесс требует специализированных знаний и часто приводит к растраченным циклам GPU. Инструмент Anyscale решает эту проблему, рассматривая пост-обучение как автоматизированный конвейер, а не как последовательность ручных шагов.
Встроенное планирование GPU
Ключевая часть инструмента — возможность планирования использования GPU. Он оценивает объем памяти и вычислительных ресурсов, необходимых для данной модели и метода тонкой настройки, а затем предлагает подходящее количество и тип GPU. Это может помочь командам избежать избыточного выделения ресурсов или нехватки памяти во время выполнения задачи. Anyscale позиционирует это как практическое решение для команд, которым необходимо выполнять тонкую настройку моделей без привлечения целой команды инженеров машинного обучения.
Доступность релиза
Инструмент доступен сейчас как часть платформы Anyscale. Пользователи могут протестировать его на инфраструктуре компании. Пока неясно, как инструмент будет справляться с очень большими моделями или экзотическими аппаратными конфигурациями, и Anyscale еще не опубликовала сравнительные тесты с ручными процессами тонкой настройки. Компания заявляет, что будет продолжать обновлять инструмент на основе отзывов пользователей.



