الانتقال إلى المحتوى الرئيسي
POST
/
v1
/
embeddings
from openai import OpenAI

client = OpenAI(
    base_url="https://api.cometapi.com/v1",
    api_key="<COMETAPI_KEY>",
)

response = client.embeddings.create(
    model="text-embedding-3-small",
    input="The food was delicious and the waiter was friendly.",
)

print(response.data[0].embedding[:5])  # First 5 dimensions
print(f"Dimensions: {len(response.data[0].embedding)}")
{
  "object": "list",
  "data": [
    {
      "object": "embedding",
      "index": 0,
      "embedding": [
        -0.0021,
        -0.0491,
        0.0209,
        0.0314,
        -0.0453
      ]
    }
  ],
  "model": "text-embedding-3-small",
  "usage": {
    "prompt_tokens": 2,
    "total_tokens": 2
  }
}

نظرة عامة

تُنشئ واجهة Embeddings API تمثيلات متجهية للنص تلتقط المعنى الدلالي. ويمكن استخدام هذه المتجهات في البحث الدلالي، والتجميع، والتصنيف، واكتشاف الشذوذ، والتوليد المعزز بالاسترجاع (RAG). تدعم CometAPI نماذج embedding من عدة مزودين. مرّر سلسلة نصية واحدة أو أكثر، وستتلقى متجهات رقمية يمكنك تخزينها في قاعدة بيانات متجهية أو استخدامها مباشرةً في حسابات التشابه.

النماذج المتاحة

ModelDimensionsMax TokensBest For
text-embedding-3-large3,072 (قابل للتعديل)8,191أعلى جودة للتمثيلات المضمنة
text-embedding-3-small1,536 (قابل للتعديل)8,191اقتصادي وسريع
text-embedding-ada-0021,536 (ثابت)8,191التوافق مع الأنظمة القديمة
راجع قائمة النماذج للاطلاع على جميع نماذج embedding المتاحة والأسعار.

ملاحظات مهمة

تقليل الأبعاد — تدعم نماذج text-embedding-3-* المعامل dimensions، مما يتيح لك تقصير متجه embedding دون فقدان كبير في الدقة. ويمكن أن يقلل ذلك تكاليف التخزين بنسبة تصل إلى 75% مع الاحتفاظ بمعظم المعلومات الدلالية.
إدخال دفعي — يمكنك إنشاء embeddings لعدة نصوص في طلب واحد من خلال تمرير مصفوفة من السلاسل النصية إلى المعامل input. ويُعد ذلك أكثر كفاءة بكثير من إجراء طلبات منفصلة لكل نص.

التفويضات

Authorization
string
header
مطلوب

Bearer token authentication. Use your CometAPI key.

الجسم

application/json
model
string
مطلوب

The embedding model to use. See the Models page for current embedding model IDs.

مثال:

"text-embedding-3-small"

input
مطلوب

The text to embed. Can be a single string, an array of strings, or an array of token arrays. Each input must not exceed the model's maximum token limit (8,191 tokens for text-embedding-3-* models).

encoding_format
enum<string>
افتراضي:float

The format of the returned embedding vectors. float returns an array of floating-point numbers. base64 returns a base64-encoded string representation, which can reduce response size for large batches.

الخيارات المتاحة:
float,
base64
dimensions
integer

The number of dimensions for the output embedding vector. Only supported by text-embedding-3-* models. Reducing dimensions can lower storage costs while maintaining most of the embedding's utility.

النطاق المطلوب: x >= 1
user
string

A unique identifier for your end-user, which can help monitor and detect abuse.

الاستجابة

200 - application/json

A list of embedding vectors for the input text(s).

object
enum<string>

The object type, always list.

الخيارات المتاحة:
list
مثال:

"list"

data
object[]

An array of embedding objects, one per input text. When multiple inputs are provided, results are returned in the same order as the input.

model
string

The model used to generate the embeddings.

مثال:

"text-embedding-3-small"

usage
object

Token usage statistics for this request.