- Tekst-til-bilde-generering
- Bilde-til-bilde-redigering
- Komposisjon med flere bilder
- Lagring av genererte bilder
- Base URL:
https://api.cometapi.com - Installer SDK-en:
pip install google-genai(Python) ellernpm install @google/genai(Node.js)
Oppsett
Initialiser klienten med CometAPI sin base URL:Tekst-til-bilde-generering
Generer et bilde fra en tekst Prompt og lagre det til en fil.candidates[0].content.parts, som kan inneholde tekst- og/eller bildedeler:
Bilde-til-bilde-generering
Last opp et inndatabilde og transformer det med en tekst-prompt.- Python SDK-en godtar
PIL.Image-objekter direkte — ingen manuell Base64-koding er nødvendig. - Ikke inkluder prefikset
data:image/jpeg;base64,når du sender rå Base64-strenger.
Sammensetning av flere bilder
Generer et nytt bilde fra flere inndatabilder. CometAPI støtter to tilnærminger:Metode 1: Ett enkelt collage-bilde
Kombiner flere kildebilder til én collage, og beskriv deretter ønsket resultat.

Metode 2: Flere separate bilder (opptil 14)
Send flere bilder direkte. Gemini 3-modeller støtter opptil 14 referansebilder (objekter + karakterer):
4K-bildegenerering
Angiimage_config med aspect_ratio og image_size for høyoppløselig output:
Bilderedigering over flere runder (Chat)
Bruk SDK-ens chat-funksjon til å forbedre bilder iterativt:Tips
Prompt-optimalisering
Prompt-optimalisering
Spesifiser stilnøkkelord (f.eks. “cyberpunk, film grain, low contrast”), sideforhold, motiv, bakgrunn, belysning og detaljnivå.
Base64-format
Base64-format
Når du bruker rå HTTP, må du ikke inkludere prefikset
data:image/png;base64, — bruk bare den rå Base64-strengen. Python SDK håndterer dette automatisk med PIL.Image-objekter.Tving bildeutdata
Tving bildeutdata
Sett
"responseModalities" til bare ["IMAGE"] for å garantere bildeutdata uten tekst.