- Tạo ảnh từ văn bản
- Chỉnh sửa ảnh từ ảnh đầu vào
- Ghép nhiều hình ảnh
- Lưu ảnh được tạo
- Base URL:
https://api.cometapi.com - Cài đặt SDK:
pip install google-genai(Python) hoặcnpm install @google/genai(Node.js)
Thiết lập
Khởi tạo client với base URL của CometAPI:Tạo ảnh từ văn bản
Tạo một hình ảnh từ prompt văn bản và lưu vào tệp.candidates[0].content.parts, có thể chứa các phần văn bản và/hoặc hình ảnh:
Tạo ảnh từ ảnh
Tải lên một ảnh đầu vào và biến đổi nó bằng một Prompt văn bản.- SDK Python chấp nhận trực tiếp các đối tượng
PIL.Image— không cần mã hóa Base64 thủ công. - Không thêm tiền tố
data:image/jpeg;base64,khi truyền chuỗi Base64 thô.
Ghép nhiều ảnh
Tạo một hình ảnh mới từ nhiều hình ảnh đầu vào. CometAPI hỗ trợ hai cách tiếp cận:Cách 1: Một ảnh ghép collage duy nhất
Kết hợp nhiều ảnh nguồn thành một ảnh collage, sau đó mô tả đầu ra mong muốn.

Cách 2: Nhiều ảnh riêng biệt (tối đa 14 ảnh)
Truyền trực tiếp nhiều ảnh. Các model Gemini 3 hỗ trợ tối đa 14 ảnh tham chiếu (đối tượng + nhân vật):
Tạo ảnh 4K
Chỉ địnhimage_config với aspect_ratio và image_size để xuất ra đầu ra độ phân giải cao:
Chỉnh sửa ảnh nhiều lượt (Chat)
Sử dụng tính năng chat của SDK để tinh chỉnh ảnh theo từng bước lặp:Mẹo
Tối ưu Prompt
Tối ưu Prompt
Chỉ định các từ khóa về phong cách (ví dụ: “cyberpunk, film grain, low contrast”), tỷ lệ khung hình, chủ thể, nền, ánh sáng và mức độ chi tiết.
Định dạng Base64
Định dạng Base64
Khi sử dụng HTTP thô, không bao gồm tiền tố
data:image/png;base64, — chỉ dùng chuỗi Base64 thô. Python SDK tự động xử lý việc này với các đối tượng PIL.Image.Buộc xuất ra ảnh
Buộc xuất ra ảnh
Đặt
"responseModalities" thành chỉ ["IMAGE"] để đảm bảo đầu ra là ảnh mà không có văn bản.