热门

Tarsier

2个月前发布 67 00

字节跳动推出的一系列大规模视觉语言模型（LVLM），专注于视频理解任务，包括视频描述、问答、视频定位、幻觉测试等功能。

所在地：

新加坡

收录时间：

2025-11-05

打开网站手机查看

GitHub/AI开源

Tarsier

Tarsier

Tarsier是字节跳动推出的一系列大规模视觉语言模型（LVLM），专注于视频理解任务，包括视频描述、问答、定位和幻觉测试等功能。

数据统计

相关导航

Aice PS

网页版AI照片编辑器，利用Google aistudio的的先进能力，支持 AI 生成图片、智能修图、创意滤镜等功能，适用于创意设计、照片编辑等场景。

AI Companion App

AI Companion App，一键创建和训练属于你的AI伴侣/女朋友。

IP-Adapter-FaceID

该模型利用面部识别模型的面部ID嵌入，可以更准确地捕捉和再现特定人物的面部特征。IP-Adapter-FaceID结合文本描述生成可以生成高度个性化且与原始面部特征一致的图像。

Unique3D

一种图像到3D框架，可以从单视图图像高效生成高质量的3D网格。具有最先进的生成保真度和强大的通用性。

Documate

Documate是一款针对站内文档问答的开源 AI 工具，旨在将 AI 聊天对话框无缝嵌入到您的网站之中。

AIdea

AIdea 是一款支持 GPT 以及国产大语言模型通义千问、文心一言等，支持 Stable Diffusion 文生图、图生图、 SDXL1.0、超分辨率、图片上色的全能型完全开源APP。

Motia

一个专为开发者设计的AI代理框架，帮助开发者快速搭建、测试和部署生产级的 AI 代理。它强调代码优先和事件驱动，支持多语言开发，并提供可视化界面，使开发者能够专注于业务逻辑。

SurveyX

一个利用大型语言模型（LLMs）生成高质量、特定领域学术论文和调查的先进学术调查自动化系统。

退出移动版