跳转到主要内容
本文档由 AI 生成。如果您发现任何错误或有改进建议,欢迎贡献! 在 GitHub 上编辑
ElevenLabs 文本转对话节点可根据文本生成多说话人音频对话。您可以通过指定不同的文本行和每个参与者的独特声音来创建对话。该节点将对话请求发送至 ElevenLabs API,并返回生成的音频。

输入

参数数据类型是否必填范围描述
稳定性FLOAT0.0 - 1.0声音稳定性。较低的值可提供更广泛的情感范围,较高的值则产生更一致但可能单调的语音。(默认值:0.5)
应用文本规范化COMBO"auto"
"on"
"off"
文本规范化模式。‘auto’ 让系统决定,‘on’ 始终应用规范化,‘off’ 跳过规范化。
模型COMBO"eleven_v3"用于对话生成的模型。
对话条数DYNAMICCOMBO"1"
"2"
"3"
"4"
"5"
"6"
"7"
"8"
"9"
"10"
对话条目数量。选择一个数字将生成相应数量的文本和语音输入字段。
语言代码STRING-ISO-639-1 或 ISO-639-3 语言代码(例如 ‘en’、‘es’、‘fra’)。留空则自动检测。(默认值:空)
种子INT0 - 4294967295用于结果可复现的随机种子。(默认值:1)
输出格式COMBO"mp3_44100_192"
"opus_48000_192"
音频输出格式。
注意: inputs 参数是动态的。当您选择一个数字(例如 “3”)时,节点将显示三个对应的 textvoice 输入字段(例如 text1voice1text2voice2text3voice3)。每个 text 字段必须至少包含一个字符。

输出

输出名称数据类型描述
audioAUDIO以所选输出格式生成的多说话人对话音频。

Source fingerprint (SHA-256): 2e1634e90314167320d715346f8d0c691dfabe82b090391afa2b0b18a8a126d8