跳转到主要内容
本文档由 AI 生成。如果您发现任何错误或有改进建议,欢迎贡献! 在 GitHub 上编辑
LTXV 空潜变量音频节点用于创建一批空(零填充)潜变量音频张量。它通过提供的音频 VAE 模型配置来确定潜变量空间的正确维度,例如通道数和频率区间数。该空潜变量可作为 ComfyUI 中音频生成或处理工作流的起点。

输入

参数数据类型是否必填范围描述
帧数INT1 至 1000帧数。默认值为 97。
帧率INT1 至 1000每秒帧数。默认值为 25。
批量大小INT1 至 4096批次中的潜变量音频样本数量。默认值为 1。
音频VAEVAE不适用用于获取配置的音频 VAE 模型。此参数为必填项。
注意: audio_vae 输入为必填项。若未提供,节点将报错。

输出

输出名称数据类型描述
LatentLATENT一个空的潜变量音频张量,其结构为 (batch_size, z_channels, num_audio_latents, audio_freq),配置为与输入的音频 VAE 匹配。输出还包含一个设置为 “audio” 的 type 字段。

Source fingerprint (SHA-256): 1a8bfea98f14de014069016652b39542cfd9290cae2d870ab4e381e46aa1e08f