跳转到主要内容
本文档由 AI 生成。如果您发现任何错误或有改进建议,欢迎贡献! 在 GitHub 上编辑
ElevenLabs文本转语音节点使用ElevenLabs API将书面文本转换为语音音频。它允许您选择特定语音并微调稳定性、速度和风格等各种语音特性,以生成自定义音频输出。

输入

参数数据类型是否必需范围描述
voiceCUSTOM不适用用于语音合成的语音。从语音选择器或即时语音克隆连接。
textSTRING不适用要转换为语音的文本。
stabilityFLOAT0.0 - 1.0语音稳定性。较低的值提供更广泛的情感范围,较高的值产生更一致但可能单调的语音(默认值:0.5)。
apply_text_normalizationCOMBO"auto"
"on"
"off"
文本规范化模式。“auto”让系统决定,“on”始终应用规范化,“off”跳过规范化。
modelDYNAMICCOMBO"eleven_multilingual_v2"
"eleven_v3"
用于文本转语音的模型。选择模型后会显示其特定参数。
language_codeSTRING不适用ISO-639-1或ISO-639-3语言代码(例如”en”、“es”、“fra”)。留空以自动检测(默认值:"")。
seedINT0 - 2147483647用于可复现性的种子(不保证确定性)(默认值:1)。
output_formatCOMBO"mp3_44100_192"
"opus_48000_192"
音频输出格式。
模型特定参数:model参数设置为"eleven_multilingual_v2"时,以下额外参数可用:
  • speed:语速。1.0为正常,<1.0为较慢,>1.0为较快(默认值:1.0,范围:0.7 - 1.3)。
  • similarity_boost:相似度增强。较高的值使语音更接近原始语音(默认值:0.75,范围:0.0 - 1.0)。
  • use_speaker_boost:增强与原始说话人语音的相似度(默认值:False)。
  • style:风格夸张程度。较高的值增加风格表现力,但可能降低稳定性(默认值:0.0,范围:0.0 - 0.2)。
model参数设置为"eleven_v3"时,以下额外参数可用:
  • speed:语速。1.0为正常,<1.0为较慢,>1.0为较快(默认值:1.0,范围:0.7 - 1.3)。
  • similarity_boost:相似度增强。较高的值使语音更接近原始语音(默认值:0.75,范围:0.0 - 1.0)。

输出

输出名称数据类型描述
audioAUDIO文本转语音转换生成的音频。

Source fingerprint (SHA-256): d11d4ffa2d1f11dfd5ce378d9496cd9788d2197bf7f4135092ecefb287f3c2f7