本文档由 AI 生成。如果您发现任何错误或有改进建议,欢迎贡献! 在 GitHub 上编辑
Kling 唇形同步音频转视频节点
此节点可将视频文件中的嘴部动作与音频文件中的音频内容同步。该节点会分析音频中的语音模式,并调整视频中的面部动作,以创建逼真的唇形同步效果。此过程需要包含清晰面部的视频以及包含清晰可辨语音的音频文件。输入
| 参数 | 数据类型 | 是否必需 | 范围 | 描述 |
|---|---|---|---|---|
视频 | VIDEO | 是 | - | 包含待同步嘴部动作面部的视频文件 |
音频 | AUDIO | 是 | - | 包含待与视频同步语音的音频文件 |
语音语言 | COMBO | 是 | "en""zh""es""fr""de""it""pt""pl""tr""ru""nl""cs""ar""ja""hu""ko" | 音频文件中语音的语言(默认值:“en”) |
- 音频文件大小不应超过 5MB
- 视频文件大小不应超过 100MB
- 视频尺寸的高/宽应在 720px 至 1920px 之间
- 视频时长应在 2 秒至 10 秒之间
- 音频必须包含清晰可辨的语音
- 视频必须包含清晰的面部
输出
| 输出名称 | 数据类型 | 描述 |
|---|---|---|
视频ID | VIDEO | 经过唇形同步嘴部动作处理后的视频 |
时长 | STRING | 处理后的视频的唯一标识符 |
duration | STRING | 处理后的视频时长 |
Source fingerprint (SHA-256):
92b8a7a4f9508632155a5f69707ffc4a14f2f44c04e4d01bf46476a972465592