本文档由 AI 生成。如果您发现任何错误或有改进建议,欢迎贡献! 在 GitHub 上编辑LTXV 空潜变量音频节点用于创建一批空(零填充)潜变量音频张量。它通过提供的音频 VAE 模型配置来确定潜变量空间的正确维度,例如通道数和频率区间数。该空潜变量可作为 ComfyUI 中音频生成或处理工作流的起点。
输入
| 参数 | 数据类型 | 是否必填 | 范围 | 描述 |
|---|---|---|---|---|
帧数 | INT | 是 | 1 至 1000 | 帧数。默认值为 97。 |
帧率 | INT | 是 | 1 至 1000 | 每秒帧数。默认值为 25。 |
批量大小 | INT | 是 | 1 至 4096 | 批次中的潜变量音频样本数量。默认值为 1。 |
音频VAE | VAE | 是 | 不适用 | 用于获取配置的音频 VAE 模型。此参数为必填项。 |
audio_vae 输入为必填项。若未提供,节点将报错。
输出
| 输出名称 | 数据类型 | 描述 |
|---|---|---|
Latent | LATENT | 一个空的潜变量音频张量,其结构为 (batch_size, z_channels, num_audio_latents, audio_freq),配置为与输入的音频 VAE 匹配。输出还包含一个设置为 “audio” 的 type 字段。 |
Source fingerprint (SHA-256):
1a8bfea98f14de014069016652b39542cfd9290cae2d870ab4e381e46aa1e08f