Tarsier

179 00

字节跳动推出的一系列大规模视觉语言模型（LVLM），专注于视频理解任务，包括视频描述、问答、视频定位、幻觉测试等功能。

打开网站替代方案

GitHub/AI开源

Tarsier

Tarsier

百度秒哒

Tarsier是字节跳动推出的一系列大规模视觉语言模型（LVLM），专注于视频理解任务，包括视频描述、问答、定位和幻觉测试等功能。