跳转到主要内容
本文档由 AI 生成。如果您发现任何错误或有改进建议,欢迎贡献! 在 GitHub 上编辑

Kling 唇形同步音频转视频节点

此节点可将视频文件中的嘴部动作与音频文件中的音频内容同步。该节点会分析音频中的语音模式,并调整视频中的面部动作,以创建逼真的唇形同步效果。此过程需要包含清晰面部的视频以及包含清晰可辨语音的音频文件。

输入

参数数据类型是否必需范围描述
视频VIDEO-包含待同步嘴部动作面部的视频文件
音频AUDIO-包含待与视频同步语音的音频文件
语音语言COMBO"en"
"zh"
"es"
"fr"
"de"
"it"
"pt"
"pl"
"tr"
"ru"
"nl"
"cs"
"ar"
"ja"
"hu"
"ko"
音频文件中语音的语言(默认值:“en”)
重要限制条件:
  • 音频文件大小不应超过 5MB
  • 视频文件大小不应超过 100MB
  • 视频尺寸的高/宽应在 720px 至 1920px 之间
  • 视频时长应在 2 秒至 10 秒之间
  • 音频必须包含清晰可辨的语音
  • 视频必须包含清晰的面部

输出

输出名称数据类型描述
视频IDVIDEO经过唇形同步嘴部动作处理后的视频
时长STRING处理后的视频的唯一标识符
durationSTRING处理后的视频时长

Source fingerprint (SHA-256): 92b8a7a4f9508632155a5f69707ffc4a14f2f44c04e4d01bf46476a972465592