Ana içeriğe atla
POST
/
v1
/
embeddings
from openai import OpenAI

client = OpenAI(
    base_url="https://api.cometapi.com/v1",
    api_key="<COMETAPI_KEY>",
)

response = client.embeddings.create(
    model="text-embedding-3-small",
    input="The food was delicious and the waiter was friendly.",
)

print(response.data[0].embedding[:5])  # First 5 dimensions
print(f"Dimensions: {len(response.data[0].embedding)}")
{
  "object": "list",
  "data": [
    {
      "object": "embedding",
      "index": 0,
      "embedding": [
        -0.0021,
        -0.0491,
        0.0209,
        0.0314,
        -0.0453
      ]
    }
  ],
  "model": "text-embedding-3-small",
  "usage": {
    "prompt_tokens": 2,
    "total_tokens": 2
  }
}

Genel Bakış

Embeddings API, anlamsal anlamı yakalayan metinlerin vektör temsillerini üretir. Bu vektörler anlamsal arama, kümeleme, sınıflandırma, anomali tespiti ve retrieval-augmented generation (RAG) için kullanılabilir. CometAPI, birden fazla sağlayıcının embedding modellerini destekler. Bir veya daha fazla metin dizesi gönderin ve vektör veritabanında saklayabileceğiniz veya benzerlik hesaplamalarında doğrudan kullanabileceğiniz sayısal vektörleri geri alın.

Kullanılabilir Modeller

ModelBoyutlarMaksimum TokenEn Uygun Olduğu Alan
text-embedding-3-large3,072 (ayarlanabilir)8,191En yüksek kaliteli embeddings
text-embedding-3-small1,536 (ayarlanabilir)8,191Uygun maliyetli, hızlı
text-embedding-ada-0021,536 (sabit)8,191Eski sürüm uyumluluğu
Mevcut tüm embedding modelleri ve fiyatlandırma için model listesine bakın.

Önemli Notlar

Boyutları Azaltmatext-embedding-3-* modelleri dimensions parametresini destekler; bu sayede doğrulukta belirgin bir kayıp olmadan embedding vektörünü kısaltabilirsiniz. Bu, anlamsal bilginin büyük kısmını korurken depolama maliyetlerini %75’e kadar azaltabilir.
Toplu Girdiinput parametresine bir dizi string göndererek tek bir istekte birden fazla metni embed edebilirsiniz. Bu, her metin için ayrı ayrı istek yapmaktan çok daha verimlidir.

Yetkilendirmeler

Authorization
string
header
gerekli

Bearer token authentication. Use your CometAPI key.

Gövde

application/json
model
string
gerekli

The embedding model to use. See the Models page for current embedding model IDs.

Örnek:

"text-embedding-3-small"

input
gerekli

The text to embed. Can be a single string, an array of strings, or an array of token arrays. Each input must not exceed the model's maximum token limit (8,191 tokens for text-embedding-3-* models).

encoding_format
enum<string>
varsayılan:float

The format of the returned embedding vectors. float returns an array of floating-point numbers. base64 returns a base64-encoded string representation, which can reduce response size for large batches.

Mevcut seçenekler:
float,
base64
dimensions
integer

The number of dimensions for the output embedding vector. Only supported by text-embedding-3-* models. Reducing dimensions can lower storage costs while maintaining most of the embedding's utility.

Gerekli aralık: x >= 1
user
string

A unique identifier for your end-user, which can help monitor and detect abuse.

Yanıt

200 - application/json

A list of embedding vectors for the input text(s).

object
enum<string>

The object type, always list.

Mevcut seçenekler:
list
Örnek:

"list"

data
object[]

An array of embedding objects, one per input text. When multiple inputs are provided, results are returned in the same order as the input.

model
string

The model used to generate the embeddings.

Örnek:

"text-embedding-3-small"

usage
object

Token usage statistics for this request.