xAI đã triển khai một công cụ mới có tên Grok Imagine 1.5 Preview, một mô hình chuyển đổi hình ảnh thành video hiện có sẵn qua API của họ. Động thái này cho phép tạo video trực tiếp từ hình ảnh tĩnh, với đầu ra giới hạn ở độ phân giải 720p.
API cung cấp những gì
Các nhà phát triển có thể đưa một hình ảnh vào mô hình và nhận lại một video, không cần quy trình chỉnh sửa video riêng biệt. Công ty mô tả quy trình làm việc là liền mạch — tải lên một bức ảnh và API xử lý phần còn lại. Grok Imagine 1.5 Preview là bổ sung mới nhất cho dòng công cụ AI tạo sinh của xAI, vốn trước đây tập trung vào tạo văn bản và hình ảnh.
Đầu ra 720p và ứng dụng thực tế
Mô hình tạo video ở độ phân giải 720p, một mức phân giải trung bình cân bằng giữa chất lượng và chi phí tính toán. Điều này khiến nó phù hợp với các đoạn clip ngắn, nội dung mạng xã hội hoặc nguyên mẫu hơn là sản xuất chất lượng điện ảnh. xAI chưa tiết lộ độ dài clip tối đa hoặc giới hạn kích thước tệp cho phiên bản xem trước.
Đối với các nhóm đang xây dựng ứng dụng cần biến các bức ảnh sản phẩm, tác phẩm nghệ thuật hoặc ảnh do người dùng tải lên thành các vòng lặp video ngắn, API loại bỏ nhu cầu sử dụng dịch vụ kết xuất bên ngoài. Động thái này cũng đưa xAI vào cuộc cạnh tranh trực tiếp hơn với các mô hình chuyển đổi hình ảnh thành video khác từ các công ty như Runway và Stability AI, mặc dù nhãn 1.5 Preview cho thấy tính năng này vẫn đang ở giai đoạn đầu.
Những điều chưa được biết
Giá của API chưa được công bố — bản xem trước có thể nằm trong các mức sử dụng tiêu chuẩn của xAI. Công ty cũng chưa cho biết khi nào hoặc liệu có phiên bản dành cho người dùng phổ thông của Grok Imagine xuất hiện trong ứng dụng chatbot của họ hay không. Hiện tại, mô hình này chỉ là công cụ dành cho nhà phát triển và những người dùng quan tâm sẽ cần khóa API để thử nghiệm.




