本文档由 AI 生成。如果您发现任何错误或有改进建议,欢迎贡献! 在 GitHub 上编辑TextEncodeAceStepAudio 节点通过将标签和歌词合并为词元(tokens)来处理音频条件化的文本输入,然后使用可调节的歌词强度进行编码。该节点接收一个 CLIP 模型以及文本描述和歌词,将它们一起词元化,并生成适用于音频生成任务的条件化数据。该节点通过一个强度参数来控制歌词对最终输出的影响,从而实现对歌词影响力的精细调节。
输入
| 参数 | 数据类型 | 是否必填 | 范围 | 描述 |
|---|---|---|---|---|
clip | CLIP | 是 | - | 用于词元化和编码的 CLIP 模型 |
标签 | STRING | 是 | - | 用于音频条件化的文本标签或描述(支持多行输入和动态提示) |
歌词 | STRING | 是 | - | 用于音频条件化的歌词文本(支持多行输入和动态提示) |
歌词强度 | FLOAT | 否 | 0.0 - 10.0 | 控制歌词对条件化输出影响的强度(默认值:1.0,步长:0.01) |
输出
| 输出名称 | 数据类型 | 描述 |
|---|---|---|
conditioning | CONDITIONING | 编码后的条件化数据,包含已应用歌词强度的处理文本词元 |
Source fingerprint (SHA-256):
89600133d8b0edaa36958530dacffe812675b595b0d77db702bb7709567cd83d