本文档由 AI 生成。如果您发现任何错误或有改进建议,欢迎贡献! 在 GitHub 上编辑根据文本指令转换现有音频样本的一部分。此节点允许您通过提供描述性提示来修改音频的特定部分,有效地“修复”或重新生成选定部分,同时保留音频的其余部分。
输入
| 参数 | 数据类型 | 是否必填 | 范围 | 描述 |
|---|---|---|---|---|
模型 | COMBO | 是 | ”stable-audio-2.5” | 用于音频修复的 AI 模型。 |
提示词 | STRING | 是 | 指导音频如何转换的文本描述(默认:空)。 | |
音频 | AUDIO | 是 | 要转换的输入音频文件。音频时长必须在 6 到 190 秒之间。 | |
时长 | INT | 否 | 1-190 | 控制生成音频的时长(以秒为单位)(默认:190)。 |
随机种 | INT | 否 | 0-4294967294 | 用于生成的随机种子(默认:0)。 |
步数 | INT | 否 | 4-8 | 控制采样步数(默认:8)。 |
开始遮罩 | INT | 否 | 0-190 | 要转换的音频部分的起始位置(以秒为单位)(默认:30)。 |
结束遮罩 | INT | 否 | 0-190 | 要转换的音频部分的结束位置(以秒为单位)(默认:190)。 |
mask_end 值必须大于 mask_start 值。输入音频的时长必须在 6 到 190 秒之间。
输出
| 输出名称 | 数据类型 | 描述 |
|---|---|---|
音频 | AUDIO | 转换后的音频输出,指定部分已根据提示进行了修改。 |
Source fingerprint (SHA-256):
6589fdbff8387e403055c711a61bb3000d87e5f8cd3753d6e665b723be6f43e2