跳转到主要内容
本文档由 AI 生成。如果您发现任何错误或有改进建议,欢迎贡献! 在 GitHub 上编辑
WanCameraImageToVideo 节点通过生成用于视频生成的潜在表示,将图像转换为视频序列。它处理条件化输入和可选的起始图像,以创建可用于视频模型的视频潜在表示。该节点支持相机条件和剪辑视觉输出,以增强视频生成控制。

输入

参数数据类型是否必需范围描述
正面提示词CONDITIONING-用于视频生成的正面条件化提示
负面提示词CONDITIONING-视频生成中需避免的负面条件化提示
VAEVAE-用于将图像编码到潜在空间的 VAE 模型
宽度INT16 至 MAX_RESOLUTION输出视频宽度(像素)(默认值:832,步长:16)
高度INT16 至 MAX_RESOLUTION输出视频高度(像素)(默认值:480,步长:16)
长度INT1 至 MAX_RESOLUTION视频序列中的帧数(默认值:81,步长:4)
批次大小INT1 至 4096同时生成的视频数量(默认值:1)
CLIP视觉输出CLIP_VISION_OUTPUT-可选的 CLIP 视觉输出,用于额外的条件化
起始图像IMAGE-可选的起始图像,用于初始化视频序列。提供时,视频的前几帧将基于此图像,并应用遮罩将起始帧与生成内容混合。图像会被调整大小以匹配指定的宽度和高度。
相机条件WAN_CAMERA_EMBEDDING-可选的相机嵌入条件,用于视频生成。提供时,这些条件会同时应用于正面和负面条件化。
注意: 当提供 start_image 时,节点会使用它来初始化视频序列,并应用遮罩将起始帧与生成内容混合。camera_conditionsclip_vision_output 参数是可选的,但提供时,它们会修改正面和负面提示的条件化。

输出

输出名称数据类型描述
负面提示词CONDITIONING应用了相机条件和剪辑视觉输出后的修改版正面条件化
潜空间CONDITIONING应用了相机条件和剪辑视觉输出后的修改版负面条件化
latentLATENT生成的视频潜在表示,用于视频模型。潜在张量的维度为 [batch_size, 16, frames, height/8, width/8],其中 frames 的计算方式为 ((length - 1) // 4) + 1。

Source fingerprint (SHA-256): 19d76097d580b14663afd0aab58810f9dc1685cd32e8f67aa43c820be65239e7