Google VideoPoet

6小时前发布 3 00

Google开发的一款文本图片生成视频、音频的多模态模型,与其他视频生成模型不同,VideoPoet 将多种视频生成功能组合在一个大型语言模型中。

所在地:
美国
收录时间:
2025-10-31
Google VideoPoetGoogle VideoPoet
比特指纹浏览器

VideoPoet是Google开发的一款文本图片生成视频、音频的多模态模型生成工具,VideoPoet 可以执行文本到视频、图像到视频、视频风格化、视频修复和外绘画以及视频到音频的生成。

与其他基于扩散的视频模型不同,VideoPoet 将多个视频生成功能结合在一个 LLM 中。它遵循类似于 LLM 的两步训练过程:预训练和特定任务的适应。研究人员说,预训练的LLM成为可以适应多种视频生成任务的基础。

数据统计

相关导航