跳转到主要内容
POST
/
kling
/
v1
/
videos
/
advanced-lip-sync
Create an advanced Kling lip-sync task
curl --request POST \
  --url https://api.cometapi.com/kling/v1/videos/advanced-lip-sync \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '
{
  "session_id": "806556222048190514",
  "face_choose": [
    {
      "face_id": "0",
      "sound_file": "https://cdn1.suno.ai/e5c97078-3260-4354-a3a6-1d7249262a48.mp3",
      "sound_start_time": "1200",
      "sound_end_time": "5000",
      "sound_insert_time": "0"
    }
  ]
}
'
{
  "code": 123,
  "message": "<string>",
  "data": {
    "task_id": "<string>",
    "task_status": "<string>",
    "created_at": 123,
    "updated_at": 123
  }
}
在你已经识别出源视频中的人脸后,使用此端点创建一个高级对口型任务。

调用前准备

  • 先使用 Lip-Sync 获取 session_id 和可用的 face_id
  • 构建一个或多个 face_choose 条目,将每张人脸映射到对应的音频片段
  • 确保时间相关字段描述了音频应如何在视频中对齐

任务流程

1

先识别人脸

对源视频运行 Lip-Sync,并保留返回的 session_id 以及目标 face_id 值。
2

创建高级对口型任务

通过此端点提交 session_idface_choose 数组。
3

跟踪生成的任务

保存返回的任务 id,用于状态检查和最终结果获取。
完整参数参考请参见 Kling 官方文档

授权

Authorization
string
header
必填

Bearer token authentication. Use your CometAPI key.

请求体

application/json
session_id
string
默认值:806556222048190514
必填

Session id returned by the face identification (lip-sync) endpoint.

face_choose
object[]
必填

Face-to-audio mappings. Each entry connects a detected face to an audio segment for lip-sync.

响应

200 - application/json

Task accepted.

code
integer
必填
message
string
必填
data
object
必填