- テキストから画像の生成
- 画像から画像への編集
- 複数画像の合成
- 生成した画像の保存
- Base URL:
https://api.cometapi.com - SDK のインストール:
pip install google-genai(Python)またはnpm install @google/genai(Node.js)
セットアップ
CometAPI の base URL を使ってクライアントを初期化します。テキストから画像を生成
テキストプロンプトから画像を生成し、ファイルに保存します。candidates[0].content.parts にあり、ここにはテキストパートおよび/または画像パートが含まれる場合があります。
画像から画像への生成
入力画像をアップロードし、テキストプロンプトで変換します。- Python SDK は
PIL.Imageオブジェクトを直接受け付けるため、手動で Base64 エンコードする必要はありません。 - 生の Base64 文字列を渡す際は、
data:image/jpeg;base64,のプレフィックスを含めないでください。
複数画像の合成
複数の入力画像から新しい画像を生成します。CometAPI は2つのアプローチをサポートしています。方法1: 単一のコラージュ画像
複数の元画像を1つのコラージュにまとめ、その後で希望する出力内容を記述します。

方法2: 複数の個別画像(最大14枚)
複数の画像を直接渡します。Gemini 3 モデルは最大14枚の参照画像(オブジェクト + キャラクター)をサポートします。
4K画像生成
高解像度出力を行うには、aspect_ratio と image_size を含む image_config を指定します。
マルチターン画像編集(チャット)
SDK のチャット機能を使用して、画像を反復的にブラッシュアップできます。ヒント
Prompt Optimization
Prompt Optimization
スタイルのキーワード(例: “cyberpunk, film grain, low contrast”)、アスペクト比、被写体、背景、ライティング、ディテールのレベルを指定します。
Base64 Format
Base64 Format
生の HTTP を使用する場合は、
data:image/png;base64, プレフィックスを含めず、Base64 の生文字列のみを使用してください。Python SDK では、PIL.Image オブジェクトによってこれが自動的に処理されます。Force Image Output
Force Image Output
テキストなしで画像出力を確実に行うには、
"responseModalities" を ["IMAGE"] のみに設定します。