Przejdź do głównej treści
POST
/
grok
/
v1
/
videos
/
generations
curl --request POST \
  --url https://api.cometapi.com/grok/v1/videos/generations \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '
{
  "prompt": "A candle flickers on a wooden table."
}
'
{
  "request_id": "4b2cd27e-0b0d-3dec-c31c-7572daf74bb3"
}
Użyj tego endpointu, aby uruchomić zadanie generowania wideo Grok na podstawie tekstu albo tekstu plus jednego obrazu źródłowego. Zwraca on od razu request_id, więc traktuj to jako pierwszy krok w asynchronicznym workflow.

Zacznij od małego żądania

  • Użyj model: grok-imagine-video
  • Do smoke testu pozostaw duration na 1 i resolution na 480p
  • Dodaj image.url tylko wtedy, gdy chcesz użyć image-to-video
  • Jeśli wysyłasz base64, zachowaj formę z dokumentacji i przykładu OpenAPI jako data:image/png;base64,<BASE64_IMAGE_DATA>

Przepływ zadania

1

Utwórz zadanie

Wyślij prompt i zapisz zwrócony request_id.
2

Odpytywanie do zakończenia

Wywołuj Get Video Generation Results, aż zagnieżdżony status providera przyjmie wartość done.
3

Zapisz wynik

Skopiuj końcowy video.url do własnego storage, jeśli potrzebujesz go po upływie tymczasowego okna dostarczania przez providera.

Co zmienia się w CometAPI

xAI opisuje generowanie wideo jako dwuetapowy przepływ start -> poll. CometAPI zachowuje ten sam kształt żądania i ten sam główny identyfikator modelu, ale uwierzytelniasz się swoim kluczem CometAPI i pozostajesz w bazowym URL CometAPI. Rzeczywiste żądanie 1-sekundowe w 480p zakończyło się powodzeniem 2026-03-12 i zwróciło prawdziwy URL wyniku.

Autoryzacje

Authorization
string
header
wymagane

Bearer token authentication. Use your CometAPI key.

Treść

application/json
prompt
string
wymagane

Prompt for the video job.

Przykład:

"A candle flickers on a wooden table."

aspect_ratio
enum<string>

Output aspect ratio.

Dostępne opcje:
1:1,
16:9,
9:16,
4:3,
3:4,
3:2,
2:3
duration
integer
domyślnie:1

Output duration in seconds. xAI documents a range of 1 to 15 seconds.

image
object

Optional source image for image-to-video.

model
string
domyślnie:grok-imagine-video

xAI video model id.

Przykład:

"grok-imagine-video"

output
object
resolution
enum<string>

Output resolution.

Dostępne opcje:
480p,
720p
size
string

Deprecated size field. Prefer aspect_ratio and resolution.

user
string

Optional end-user identifier.

Odpowiedź

200 - application/json

Request accepted.

request_id
string
wymagane

Deferred request id used for polling.