跳转到主要内容
本文档由 AI 生成。如果您发现任何错误或有改进建议,欢迎贡献! 在 GitHub 上编辑
LTXVSeparateAVLatent 节点接收一个组合的音频-视频潜在表示,并将其拆分为两个独立的部分:一个用于视频,一个用于音频。它会分离样本,如果存在噪声掩码,也会从输入潜在表示中分离出来,从而创建两个新的潜在对象。

输入

参数数据类型是否必填范围描述
音视频潜空间LATENT不适用待分离的组合音频-视频潜在表示。
注意: 输入潜在表示的 samples 张量在第一维度(批次维度)上应至少包含两个元素。第一个元素用于视频潜在表示,第二个元素用于音频潜在表示。如果存在 noise_mask,则会以相同方式拆分。

输出

输出名称数据类型描述
audio_latentLATENT包含分离后视频数据的潜在表示。
audio_latentLATENT包含分离后音频数据的潜在表示。

Source fingerprint (SHA-256): 55bce5d768e7fe13f885cc32d34ecdac5cdcbb667b03743004866ea4b6d58d46