Генерація контенту Gemini

Огляд

CometAPI підтримує нативний формат API Gemini, надаючи вам повний доступ до специфічних для Gemini можливостей, таких як керування thinking, Google Search grounding, нативні модальності генерації зображень та інше. Використовуйте цей endpoint, коли вам потрібні можливості, недоступні через OpenAI-compatible chat endpoint.

Швидкий старт

Замініть base URL та API key у будь-якому Gemini SDK або HTTP-клієнті:

Налаштування	Значення Google за замовчуванням	CometAPI
Base URL	`generativelanguage.googleapis.com`	`api.cometapi.com`
API Key	`$GEMINI_API_KEY`	`$COMETAPI_KEY`

Для автентифікації підтримуються як заголовки x-goog-api-key, так і Authorization: Bearer.

Thinking (Reasoning)

Моделі Gemini можуть виконувати внутрішнє reasoning перед генерацією відповіді. Спосіб керування залежить від покоління моделі.

Gemini 3 (thinkingLevel)
Gemini 2.5 (thinkingBudget)

Моделі Gemini 3 використовують thinkingLevel для керування глибиною reasoning. Доступні рівні: MINIMAL, LOW, MEDIUM, HIGH.

curl "https://api.cometapi.com/v1beta/models/gemini-3.1-pro-preview:generateContent" \
  -H "Content-Type: application/json" \
  -H "x-goog-api-key: $COMETAPI_KEY" \
  -d '{
    "contents": [{"parts": [{"text": "Explain quantum physics simply."}]}],
    "generationConfig": {
      "thinkingConfig": {"thinkingLevel": "LOW"}
    }
  }'

Моделі Gemini 2.5 використовують thinkingBudget для детального керування на рівні token:

0 — вимкнути thinking
-1 — динамічно (модель вирішує сама, за замовчуванням)
> 0 — конкретний бюджет token (наприклад, 1024, 2048)

curl "https://api.cometapi.com/v1beta/models/gemini-2.5-flash:generateContent" \
  -H "Content-Type: application/json" \
  -H "x-goog-api-key: $COMETAPI_KEY" \
  -d '{
    "contents": [{"parts": [{"text": "Solve this logic puzzle step by step."}]}],
    "generationConfig": {
      "thinkingConfig": {"thinkingBudget": 2048}
    }
  }'

Використання thinkingLevel з моделями Gemini 2.5 (або thinkingBudget з моделями Gemini 3) може спричинити помилки. Використовуйте правильний параметр для вашої версії моделі.

Streaming

Використовуйте streamGenerateContent?alt=sse як оператор, щоб отримувати Server-Sent Events у процесі генерації контенту моделлю. Кожна SSE-подія містить рядок data: з JSON-об’єктом GenerateContentResponse.

curl "https://api.cometapi.com/v1beta/models/gemini-2.5-flash:streamGenerateContent?alt=sse" \
  -H "Content-Type: application/json" \
  -H "x-goog-api-key: $COMETAPI_KEY" \
  --no-buffer \
  -d '{
    "contents": [{"parts": [{"text": "Write a short poem about the stars"}]}]
  }'

Системні інструкції

Спрямовуйте поведінку моделі протягом усієї розмови за допомогою systemInstruction:

curl "https://api.cometapi.com/v1beta/models/gemini-2.5-flash:generateContent" \
  -H "Content-Type: application/json" \
  -H "x-goog-api-key: $COMETAPI_KEY" \
  -d '{
    "contents": [{"parts": [{"text": "What is 2+2?"}]}],
    "systemInstruction": {
      "parts": [{"text": "You are a math tutor. Always show your work."}]
    }
  }'

JSON Mode

Примусово задайте структурований JSON-вивід за допомогою responseMimeType. За потреби також можна вказати responseSchema для суворої валідації схеми:

curl "https://api.cometapi.com/v1beta/models/gemini-2.5-flash:generateContent" \
  -H "Content-Type: application/json" \
  -H "x-goog-api-key: $COMETAPI_KEY" \
  -d '{
    "contents": [{"parts": [{"text": "List 3 planets with their distances from the sun"}]}],
    "generationConfig": {
      "responseMimeType": "application/json"
    }
  }'

Google Search Grounding

Увімкніть пошук у вебі в реальному часі, додавши інструмент googleSearch:

curl "https://api.cometapi.com/v1beta/models/gemini-2.5-flash:generateContent" \
  -H "Content-Type: application/json" \
  -H "x-goog-api-key: $COMETAPI_KEY" \
  -d '{
    "contents": [{"parts": [{"text": "Who won the euro 2024?"}]}],
    "tools": [{"google_search": {}}]
  }'

Відповідь містить groundingMetadata з URL-адресами джерел і оцінками впевненості.

Приклад відповіді

Типова відповідь від Gemini endpoint у CometAPI:

{
  "candidates": [
    {
      "content": {
        "role": "model",
        "parts": [{"text": "Hello"}]
      },
      "finishReason": "STOP",
      "avgLogprobs": -0.0023
    }
  ],
  "usageMetadata": {
    "promptTokenCount": 5,
    "candidatesTokenCount": 1,
    "totalTokenCount": 30,
    "trafficType": "ON_DEMAND",
    "thoughtsTokenCount": 24,
    "promptTokensDetails": [{"modality": "TEXT", "tokenCount": 5}],
    "candidatesTokensDetails": [{"modality": "TEXT", "tokenCount": 1}]
  },
  "modelVersion": "gemini-2.5-flash",
  "createTime": "2026-03-25T04:21:43.756483Z",
  "responseId": "CeynaY3LDtvG4_UP0qaCuQY"
}

Поле thoughtsTokenCount у usageMetadata показує, скільки токенів модель витратила на внутрішнє міркування, навіть якщо результат мислення не включено до відповіді.

Ключові відмінності від OpenAI-Compatible endpoint

Функція	Gemini Native (`/v1beta/models/...`)	OpenAI-Compatible (`/v1/chat/completions`)
Керування thinking	`thinkingConfig` with `thinkingLevel` / `thinkingBudget`	Недоступно
Google Search grounding	`tools: [\{"google_search": \{\}\}]`	Недоступно
Google Maps grounding	`tools: [\{"googleMaps": \{\}\}]`	Недоступно
Модальність генерації зображень	`responseModalities: ["IMAGE"]`	Недоступно
Заголовок автентифікації	`x-goog-api-key` or `Bearer`	Лише `Bearer`
Формат відповіді	Gemini native (`candidates`, `parts`)	Формат OpenAI (`choices`, `message`)

Авторизації

x-goog-api-key

string

header

обов'язково

Your CometAPI key passed via the x-goog-api-key header. Bearer token authentication (Authorization: Bearer <key>) is also supported.

Параметри шляху

model

string

обов'язково

The Gemini model ID to use. See the Models page for current Gemini model IDs.

Приклад:

"gemini-2.5-flash"

operator

enum<string>

обов'язково

The operation to perform. Use generateContent for synchronous responses, or streamGenerateContent?alt=sse for Server-Sent Events streaming.

Доступні опції:

generateContent,

streamGenerateContent?alt=sse

Приклад:

"generateContent"

Тіло

application/json

contents

object[]

обов'язково

The conversation history and current input. For single-turn queries, provide a single item. For multi-turn conversations, include all previous turns.

Show child attributes

systemInstruction

object

System instructions that guide the model's behavior across the entire conversation. Text only.

Show child attributes

tools

object[]

Tools the model may use to generate responses. Supports function declarations, Google Search, Google Maps, and code execution.

Show child attributes

toolConfig

object

Configuration for tool usage, such as function calling mode.

Show child attributes

safetySettings

object[]

Safety filter settings. Override default thresholds for specific harm categories.

Show child attributes

generationConfig

object

Configuration for model generation behavior including temperature, output length, and response format.

Show child attributes

cachedContent

string

The name of cached content to use as context. Format: cachedContents/{id}. See the Gemini context caching documentation for details.

Відповідь

200 - application/json

Successful response. For streaming requests, the response is a stream of SSE events, each containing a GenerateContentResponse JSON object prefixed with data:.

candidates

object[]

The generated response candidates.

Show child attributes

promptFeedback

object

Feedback on the prompt, including safety blocking information.

Show child attributes

usageMetadata

object

Token usage statistics for the request.

Show child attributes

modelVersion

string

The model version that generated this response.

createTime

string

The timestamp when this response was created (ISO 8601 format).

responseId

string

Unique identifier for this response.

Огляд

Довідник API

Посібники з інтеграції

Помилки

Ціни та оплата

Підтримка

Генерація контенту Gemini

Огляд

Швидкий старт

Thinking (Reasoning)

Streaming

Системні інструкції

JSON Mode

Google Search Grounding

Приклад відповіді

Ключові відмінності від OpenAI-Compatible endpoint

Авторизації

Параметри шляху

Тіло

Відповідь

Огляд

Довідник API

Посібники з інтеграції

Помилки

Ціни та оплата

Підтримка

​Огляд

​Швидкий старт

​Thinking (Reasoning)

​Streaming

​Системні інструкції

​JSON Mode

​Google Search Grounding

​Приклад відповіді

​Ключові відмінності від OpenAI-Compatible endpoint

Авторизації

Параметри шляху

Тіло

Відповідь

Огляд

Швидкий старт

Thinking (Reasoning)

Streaming

Системні інструкції

JSON Mode

Google Search Grounding

Приклад відповіді

Ключові відмінності від OpenAI-Compatible endpoint