xAIは、画像から動画を生成する新たなツール「Grok Imagine 1.5 Preview」をリリースしました。この画像-to-動画モデルはAPIを通じて利用可能で、静止画像から直接動画を生成し、出力解像度は720pに制限されています。
APIが提供する機能
開発者は画像をモデルに入力するだけで動画を取得でき、別途動画編集パイプラインは不要です。xAIはこのワークフローはシームレスだと説明しており、画像をアップロードすればAPIが残りの処理を担います。Grok Imagine 1.5 PreviewはxAIの生成AIツール群の最新版であり、これまではテキスト生成と画像生成に重点が置かれていました。
720p出力と実用的な用途
このモデルは720pで動画を生成します。これは品質と計算コストのバランスを取った中間的な解像度です。そのため、映画級の制作ではなく、短いクリップ、ソーシャルメディア向けコンテンツ、プロトタイプなどに適しています。xAIはプレビュー版の最大クリップ長やファイルサイズ制限については開示していません。
製品写真、アートワーク、ユーザーがアップロードした写真を短い動画ループに変換するアプリを構築しているチームにとって、このAPIは外部レンダリングサービスを不要にします。また、この動きによりxAIはRunwayやStability AIなどの画像-to-動画モデルを提供する企業との直接競合が激化しますが、1.5 Previewというラベルはこの機能がまだ初期段階であることを示しています。
未知の部分
APIの価格は発表されておらず、プレビュー版はおそらくxAIの標準利用枠に基づいて提供されます。また、xAIは消費者向けのGrok Imagineバージョンがいつ(あるいはそもそも)チャットボットアプリ内に登場するかについても言及していません。現時点では、このモデルは厳密に開発者向けツールであり、利用希望者はテストのためにAPIキーが必要です。



