Motion-I2V-龙跃AI

Motion-I2V

4个月前发布

4611

Motion-I2V插图

Motion-I2V

Motion-I2V是一种全新的框架，用于实现一致且可控的图像到视频生成（I2V）。与以往直接学习复杂图像到视频映射的方法不同，Motion-I2V将I2V分解为两个阶段，并采用显式运动建模。在第一阶段，我们提出了基于扩散的运动场预测器，专注于推断参考图像像素的轨迹。在第二阶段，我们提出了增强的运动增强时间注意力，以增强视频潜在扩散模型中有限的一维时间注意力。该模块可以在第一阶段预测的轨迹的指导下，有效地将参考图像特征传播到合成帧。与现有方法相比，Motion-I2V即使在存在大运动和视角变化的情况下，也能生成更一致的视频。通过为第一阶段训练稀疏轨迹控制网络，Motion-I2V可以支持用户精确控制运动轨迹和运动区域，具有稀疏轨迹和区域注释的控制能力。这比仅依赖文本说明更可控。此外，Motion-I2V的第二阶段自然地支持零样本视频到视频转换。定性和定量比较表明，Motion-I2V在一致且可控的图像到视频生成方面优于先前的方法。

需求人群：

“Motion-I2V可用于生成一致且可控的图像到视频，支持用户精确控制运动轨迹和区域，并实现零样本视频到视频转换。”

使用场景示例：

一个摄影爱好者使用Motion-I2V生成一组连贯且可控的风景照片到视频作品。

一家广告公司利用Motion-I2V生成具有特定视觉效果的产品宣传视频。

一位艺术家使用Motion-I2V将静态艺术作品转化为具有动态效果的视频展示。

产品特色：

基于扩散的运动场预测

运动增强时间注意力

稀疏轨迹控制网络训练

© 版权声明

文章版权归作者所有，未经允许请勿转载。

THE END

喜欢就支持一下吧

相关推荐