Anyscale、LLMファインチューニングのための自動ポストトレーニングツールを発表

Anyscaleは、大規模言語モデルのポストトレーニングフェーズを効率化する新しいツールをリリースしました。このツールは、手法の選択、GPU計画、構成生成などのタスクを自動化します。同社は、LLMを本番環境にデプロイする際に複雑でリソースを要する部分を簡素化することを目指していると述べています。

ツールが自動化するもの

このツールはファインチューニングプロセスに焦点を当てています。通常、エンジニアはフルファインチューニング、LoRA、QLoRAなどのアプローチを手動で選択し、適切なGPU設定やハイパーパラメータを決定する必要があります。Anyscaleのシステムはこれらの判断を代行し、モデルとユーザーのハードウェア制約に合った構成を生成します。同社はこれにより、試行錯誤の時間を短縮し、設定ミスによる実行失敗のリスクを低減できると主張しています。

ポストトレーニングが今重要である理由

組織がLLMの実験から実際のデプロイへと移行するにつれ、ファインチューニングがボトルネックになっています。既製のモデルは特定のドメインやタスクに合わせた調整が必要になることが多いですが、そのプロセスには専門知識が必要であり、GPUサイクルの無駄が生じることがよくあります。Anyscaleのツールは、ポストトレーニングを手動の一連のステップではなく自動化されたパイプラインとして扱うことで、この問題に対処します。

GPU計画を組み込み

このツールの重要な部分は、GPU使用量を計画する機能です。特定のモデルとファインチューニング手法に必要なメモリと計算能力を見積もり、適切なGPUの数と種類を提案します。これにより、チームは過剰なプロビジョニングやジョブ途中でのメモリ不足を回避できます。Anyscaleは、このツールをMLエンジニアのチーム全体を専任にすることなくモデルをファインチューニングする必要があるチーム向けの実用的なソリューションとして位置づけています。

リリースの利用可能性

このツールは現在、Anyscaleのプラットフォームの一部として利用可能です。ユーザーは同社のインフラ上でテストできます。非常に大規模なモデルや特殊なハードウェア構成にどのように対応するかは不明であり、Anyscaleはまだ手動ファインチューニングワークフローとのベンチマーク比較を公開していません。同社はユーザーフィードバックに基づいてツールを継続的に更新すると述べています。

ツールが自動化するもの

ポストトレーニングが今重要である理由

GPU計画を組み込み

リリースの利用可能性

関連記事