跳转到主要内容
本文档由 AI 生成。如果您发现任何错误或有改进建议,欢迎贡献! 在 GitHub 上编辑
TextEncodeAceStepAudio 节点通过将标签和歌词合并为词元(tokens)来处理音频条件化的文本输入,然后使用可调节的歌词强度进行编码。该节点接收一个 CLIP 模型以及文本描述和歌词,将它们一起词元化,并生成适用于音频生成任务的条件化数据。该节点通过一个强度参数来控制歌词对最终输出的影响,从而实现对歌词影响力的精细调节。

输入

参数数据类型是否必填范围描述
clipCLIP-用于词元化和编码的 CLIP 模型
标签STRING-用于音频条件化的文本标签或描述(支持多行输入和动态提示)
歌词STRING-用于音频条件化的歌词文本(支持多行输入和动态提示)
歌词强度FLOAT0.0 - 10.0控制歌词对条件化输出影响的强度(默认值:1.0,步长:0.01)

输出

输出名称数据类型描述
conditioningCONDITIONING编码后的条件化数据,包含已应用歌词强度的处理文本词元

Source fingerprint (SHA-256): 89600133d8b0edaa36958530dacffe812675b595b0d77db702bb7709567cd83d