- Generación de texto a imagen
- Edición de imagen a imagen
- Composición de múltiples imágenes
- Guardado de imágenes generadas
- Base URL:
https://api.cometapi.com - Instala el SDK:
pip install google-genai(Python) onpm install @google/genai(Node.js)
Configuración
Inicializa el cliente con la base URL de CometAPI:Generación de texto a imagen
Genera una imagen a partir de un prompt de texto y guárdala en un archivo.candidates[0].content.parts, que puede contener partes de texto y/o de imagen:
Generación de imagen a imagen
Sube una imagen de entrada y transfórmala con un prompt de texto.- El SDK de Python acepta objetos
PIL.Imagedirectamente; no se necesita codificación manual en Base64. - No incluyas el prefijo
data:image/jpeg;base64,al pasar cadenas Base64 sin procesar.
Composición de múltiples imágenes
Genera una nueva imagen a partir de varias imágenes de entrada. CometAPI admite dos enfoques:Método 1: Una sola imagen de collage
Combina varias imágenes de origen en un solo collage y luego describe el resultado deseado.

Método 2: Varias imágenes separadas (hasta 14)
Pasa varias imágenes directamente. Los modelos Gemini 3 admiten hasta 14 imágenes de referencia (objetos + personajes):
Generación de imágenes 4K
Especificaimage_config con aspect_ratio e image_size para una salida de alta resolución:
Edición de Imágenes en Múltiples Turnos (Chat)
Usa la función de chat del SDK para refinar imágenes de forma iterativa:Consejos
Optimización de Prompt
Optimización de Prompt
Especifica palabras clave de estilo (p. ej., “cyberpunk, film grain, low contrast”), relación de aspecto, sujeto, fondo, iluminación y nivel de detalle.
Formato Base64
Formato Base64
Al usar HTTP sin procesar, no incluyas el prefijo
data:image/png;base64, — usa solo la cadena Base64 sin procesar. El SDK de Python maneja esto automáticamente con objetos PIL.Image.Forzar salida de imagen
Forzar salida de imagen
Configura
"responseModalities" en ["IMAGE"] únicamente para garantizar una salida de imagen sin texto.