2VGen-XL简介
I2VGen-XL项目由阿里云达摩院研发,用于根据输入图像生成高清视频。模型经大规模视频和图像数据混合预训练,并在少量精品数据上微调,具有良好的泛化性。相比现有的视频生成模型,I2VGen-XL在清晰度、质感、语义、时序连续性等方面具有优势。
- [💡] I2VGen-XL模型的核心部分包含两个阶段,分别解决语义一致性和清晰度的问题,参数量共计约37亿。
- [👍] I2VGen-XL模型在大规模视频和图像数据混合预训练,并在少量精品数据上微调,具有良好的泛化性。
- [🎯] 相比现有的视频生成模型,I2VGen-XL在清晰度、质感、语义、时序连续性等方面具有优势。
- [🎬] I2VGen-XL模型可以直接生成720P分辨率的视频,无水印,适用更多视频平台,减少许多限制。
- [🔧] I2VGen-XL模型在处理小目标生成、快速运动目标生成以及生成速度等方面存在局限性。
- [📚] I2VGen-XL模型的训练数据来源广泛,类别分布广,数据来源于开源数据、视频网站以及其他内部数据,具有多分辨率、长宽比等。
2VGen-XL生成效果
2VGen-XL模型体验
Demo:https://modelscope.cn/studios/damo/I2VGen-XL-Demo/summary
2VGen-XL项目
Paper: https://arxiv.org/abs/2306.02018
项目开源地址:https://modelscope.cn/models/damo/Image-to-Video/summary
© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END
暂无评论内容