Firma xAI wprowadziła nowe narzędzie o nazwie Grok Imagine 1.5 Preview – model obraz-wideo dostępny teraz przez jej interfejs API. To posunięcie umożliwia generowanie wideo bezpośrednio ze statycznych obrazów, a wynik jest ograniczony do rozdzielczości 720p.
Co oferuje API
Deweloperzy mogą przesłać obraz do modelu i otrzymać wideo – bez potrzeby korzystania z oddzielnego procesu edycji wideo. Firma opisuje ten przepływ pracy jako płynny: wystarczy przesłać zdjęcie, a API resztą zajmuje się samo. Grok Imagine 1.5 Preview to najnowszy dodatek do linii generatywnych narzędzi AI xAI, które dotychczas koncentrowały się na tworzeniu tekstu i obrazów.
Wyjście 720p i zastosowanie w praktyce
Model generuje wideo w rozdzielczości 720p – to kompromis pomiędzy jakością a kosztem obliczeniowym. Dzięki temu nadaje się do krótkich klipów, treści w mediach społecznościowych lub prototypów, a nie do produkcji kinowej. xAI nie ujawniło jeszcze maksymalnej długości klipu ani limitów rozmiaru pliku w wersji preview.
Dla zespołów tworzących aplikacje, które muszą przekształcić zdjęcia produktów, grafiki lub przesłane przez użytkowników fotografie w krótkie pętle wideo, API eliminuje potrzebę korzystania z zewnętrznych usług renderowania. To posunięcie stawia także xAI w bardziej bezpośredniej konkurencji z innymi modelami obraz-wideo od firm takich jak Runway czy Stability AI, choć etykieta 1.5 Preview sugeruje, że funkcja jest wciąż na wczesnym etapie.
Czego jeszcze nie wiemy
Ceny API nie zostały ogłoszone – wersja preview najprawdopodobniej korzysta ze standardowych progów użycia xAI. Firma nie podała też, kiedy ani czy w ogóle konsumencka wersja Grok Imagine pojawi się w jej aplikacji czatowej. Na razie model jest narzędziem wyłącznie dla deweloperów, a zainteresowani użytkownicy będą potrzebować klucza API, aby go przetestować.




