一个由阶跃星辰与吉利汽车合作开源的先进文本到视频生成模型。支持中文与英文提示输入,应用于在如广告、影视制作、自动化内容创作等场景。
Step-Video-T2V是一个由阶跃星辰与吉利汽车合作开源的先进文本到视频生成模型。它具备诸多突出特性,在视频生成领域展现出强大实力。
Step-Video-T2V模型的亮点
运用DiT模型和流匹配训练方法,实现了16×16倍空间压缩以及8倍时间压缩,极大地提升了大规模视频生成的效率。拥有300亿庞大参数参数,能够生成分辨率高达544×992的高质量高分辨率视频。支持中文与英文提示输入,方便不同语言背景的用户使用。