本文档由 AI 生成。如果您发现任何错误或有改进建议,欢迎贡献! 在 GitHub 上编辑LTXVSeparateAVLatent 节点接收一个组合的音频-视频潜在表示,并将其拆分为两个独立的部分:一个用于视频,一个用于音频。它会分离样本,如果存在噪声掩码,也会从输入潜在表示中分离出来,从而创建两个新的潜在对象。
输入
| 参数 | 数据类型 | 是否必填 | 范围 | 描述 |
|---|---|---|---|---|
音视频潜空间 | LATENT | 是 | 不适用 | 待分离的组合音频-视频潜在表示。 |
samples 张量在第一维度(批次维度)上应至少包含两个元素。第一个元素用于视频潜在表示,第二个元素用于音频潜在表示。如果存在 noise_mask,则会以相同方式拆分。
输出
| 输出名称 | 数据类型 | 描述 |
|---|---|---|
audio_latent | LATENT | 包含分离后视频数据的潜在表示。 |
audio_latent | LATENT | 包含分离后音频数据的潜在表示。 |
Source fingerprint (SHA-256):
55bce5d768e7fe13f885cc32d34ecdac5cdcbb667b03743004866ea4b6d58d46