ElevenLabsTextToSpeech - ComfyUI Built-in Node Documentation

本文档由 AI 生成。如果您发现任何错误或有改进建议，欢迎贡献！在 GitHub 上编辑

ElevenLabs文本转语音节点使用ElevenLabs API将书面文本转换为语音音频。它允许您选择特定语音并微调稳定性、速度和风格等各种语音特性，以生成自定义音频输出。

输入

参数	数据类型	是否必需	范围	描述
`voice`	CUSTOM	是	不适用	用于语音合成的语音。从语音选择器或即时语音克隆连接。
`text`	STRING	是	不适用	要转换为语音的文本。
`stability`	FLOAT	否	0.0 - 1.0	语音稳定性。较低的值提供更广泛的情感范围，较高的值产生更一致但可能单调的语音（默认值：0.5）。
`apply_text_normalization`	COMBO	否	`"auto"` `"on"` `"off"`	文本规范化模式。“auto”让系统决定，“on”始终应用规范化，“off”跳过规范化。
`model`	DYNAMICCOMBO	否	`"eleven_multilingual_v2"` `"eleven_v3"`	用于文本转语音的模型。选择模型后会显示其特定参数。
`language_code`	STRING	否	不适用	ISO-639-1或ISO-639-3语言代码（例如”en”、“es”、“fra”）。留空以自动检测（默认值：""）。
`seed`	INT	否	0 - 2147483647	用于可复现性的种子（不保证确定性）（默认值：1）。
`output_format`	COMBO	否	`"mp3_44100_192"` `"opus_48000_192"`	音频输出格式。

模型特定参数： 当model参数设置为"eleven_multilingual_v2"时，以下额外参数可用：

当model参数设置为"eleven_v3"时，以下额外参数可用：

输出名称	数据类型	描述
`audio`	AUDIO	文本转语音转换生成的音频。

Source fingerprint (SHA-256): d11d4ffa2d1f11dfd5ce378d9496cd9788d2197bf7f4135092ecefb287f3c2f7