- Geração de texto para imagem
- Edição de imagem para imagem
- Composição com múltiplas imagens
- Salvamento de imagens geradas
- URL base:
https://api.cometapi.com - Instale o SDK:
pip install google-genai(Python) ounpm install @google/genai(Node.js)
Configuração
Inicialize o cliente com a URL base do CometAPI:Geração de Text-to-Image
Gere uma imagem a partir de um prompt de texto e salve-a em um arquivo.candidates[0].content.parts, que podem conter partes de texto e/ou imagem:
Geração de Image-to-Image
Envie uma imagem de entrada e transforme-a com um prompt de texto.- O SDK Python aceita objetos
PIL.Imagediretamente — não é necessária codificação manual em Base64. - Não inclua o prefixo
data:image/jpeg;base64,ao passar strings Base64 brutas.
Composição com Múltiplas Imagens
Gere uma nova imagem a partir de várias imagens de entrada. A CometAPI oferece suporte a duas abordagens:Método 1: Uma única imagem em colagem
Combine várias imagens de origem em uma única colagem e, em seguida, descreva o resultado desejado.

Método 2: Várias imagens separadas (até 14)
Passe várias imagens diretamente. Os modelos Gemini 3 oferecem suporte a até 14 imagens de referência (objetos + personagens):
Geração de Imagens em 4K
Especifiqueimage_config com aspect_ratio e image_size para saída em alta resolução:
Edição de Imagem em Múltiplas Interações (Chat)
Use o recurso de chat do SDK para refinar imagens de forma iterativa:Dicas
Otimização de Prompt
Otimização de Prompt
Especifique palavras-chave de estilo (por exemplo, “cyberpunk, film grain, low contrast”), proporção de aspecto, assunto, plano de fundo, iluminação e nível de detalhe.
Formato Base64
Formato Base64
Ao usar HTTP bruto, não inclua o prefixo
data:image/png;base64, — use apenas a string Base64 bruta. O SDK Python lida com isso automaticamente com objetos PIL.Image.Forçar Saída de Imagem
Forçar Saída de Imagem
Defina
"responseModalities" como ["IMAGE"] apenas para garantir saída de imagem sem texto.