中国大模型列表大全中国大模型列表大全,全面收集有明确来源的大模型情况,包括机构、来源信息和分类等,随时更新。旨在记录中国大模型发展情况,欢迎在Issues中提供提供线索和素材。 1570GitHub/AI开源
FUZZ由Riffusion推出的一款基于扩散模型(Diffusion Model)的全新音乐生成模型,该工具能够通过“想象”生成音频的声谱图(Spectrogram),然后将其转换为音频。便携式音箱 1330GitHub/AI开源
React-Tetris一个用 React 框架开发的经典俄罗斯方块游戏。它用了组件化设计,能键盘控制,也能适配不同屏幕,既可以嵌入 React 应用,也能当独立组件用。 1170GitHub/AI开源
QAnything AI网易有道一个开源的本地知识库问答系统,旨在支持多种文件格式和数据库,允许离线安装和使用。 ,电子邮件(eml),TXT(txt),图像(jpg,jpeg,png),CSV(csv),网页链接(html)1140AI大模型GitHub/AI开源# 智能写作
PiliPala一款基于Flutter开发的B站开源第三方客户端。支持Android和iOS平台,提供无广告的高清视频播放体验,具备倍速播放、离线缓存、稍后再看等功能。 1320GitHub/AI开源自媒体
UIGEN-T1一个基于 Qwen2.5-Coder-7B 模型微调的开源 UI 设计生成工具,能够根据用户输入的提示生成结构清晰且符合标准的 HTML 和 CSS 代码 1180AI编程GitHub/AI开源
Anda一个以Rust为基础构建的AI智能体框架,整合了ICP区块链并且支持TEE环境,Anda的目标在于构建一个能够高度组合、自主运行且拥有持续记忆能力的AI智能体网络。 1190GitHub/AI开源智能体
QuickRecorder一款基于ScreenCapture Kit for macOS的轻量级录屏 工具/基于 ScreenCapture Kit的多功能、轻量化、高性能的开源macOS屏幕录制工具。 1670GitHub/AI开源
Notebook Copilot有了 Notebook CoPilot,开发笔记本的过程变得更加容易。这个简单的工具可以毫不费力地根据您的输入生成代码和 Markdown 单元格,从而显着简化您的工作流程。 1020GitHub/AI开源
Eigent AI全球首个桌面端多智能体生产力平台,采用多智能体协作架构,通过拆分任务、并行处理来提高复杂任务的执行效率,支持本地部署和云端运行,还有人类参与机制,能保证结果准确可靠。 1520GitHub/AI开源MCP
Awesome GPT-4o Images一个精选的GPT-4o生成图片集锦,收集了OpenAI 最新多模态模型 GPT‑4o 生成的精彩案例,展示其强大的文本‑图像理解与创作能力。 1040GitHub/AI开源
ValueCell AI全球首个开源金融智能体平台,采用社区驱动和多智能体模式,ValueCell提供选股、分析、新闻推送、市场研究、数据收集、情绪分析、策略生成等功能。 1540GitHub/AI开源
Ncurator/馆长知识库AI问答助手,让AI帮助你整理与分析知识,馆长基于语义和关键词搜索技术,当你输入问题时,馆长智能分析你的查询,并从你的知识库中检索出最相关的信息。 1440GitHub/AI开源# AI# GPT
DreamTalk一个由清华大学、阿里巴巴和华中科大共同开发的一个基于扩散模型可以让人物照片说话,支持包括歌曲、多种语言的语音、嘈杂的音频在内的各种声音匹配让人物头像说话的框架。 1190GitHub/AI开源
HandRefiner解决AI图像生成中手部畸形的问题 目前的图像生成模型,再生成图像方面已经非常出色,但在生成人类手部的图像时却常常出现问题,比如手指数量不对或者手形怪异。 1000GitHub/AI开源
Animagine XL 3.1一个开源的文本生成图像动漫模型,通过整合新的数据集,Animagine XL 3.1扩展了对广泛动漫作品和风格的理解,从经典作品到最新发布的动漫,覆盖了从古老到现代的各种艺术风格。 1170GitHub/AI开源
Platon.AI – 柏拉图智能Platon.AI柏拉图智能不仅仅是 AI 爬虫,也是 AI agents 的基础设施。 AI agents 要使用工具,就必须高速阅读理解在线网页,理解网页上的每一个元素——这就是 platon.AI 的技术。 1290GitHub/AI开源
LiveSketchLiveSketch是一款AI生成视频工具,用户通过文本提示将静态素描转化为动画,它提供了一种简单直观的方法,使他们的素描变得生动活泼。 1400GitHub/AI开源# Text-to-Video
TryOnDiffusionTryOnDiffusion就谷歌推出的一项新虚拟试穿功能,能够实现高度逼真的虚拟试穿,用户能够直观地看到不同体型的人穿着不同尺寸的衣服效果如何。 1190GitHub/AI开源
WeChat Bot基于WeChaty结合OpenAI ChatGPT、Kimi、讯飞等多种AI服务实现的开源微信机器人项目,用于自动回复微信消息或管理微信群/好友。 1700GitHub/AI开源自媒体
ChopperBot一款能用于像虎牙、斗鱼、抖音、BiliBili、TikTok、Twitch 等平台的智能直播视频剪辑发布工具,能实现自动化视频剪辑和自动化切片操作,而且非常智能。 1670GitHub/AI开源工作流/RPA
Windrecorder捕风记录仪,一款开源的屏幕录制与检索工具,它记录屏幕内容来实现记忆搜索,帮用户检索记忆线索,支持按OCR文本或画面描述查询,还提供活动统计等功能。 1180GitHub/AI开源
MotionshopAI角色动画工具,通过先进的视频处理和3D渲染技术,MotionShop能够高效地将视频中的某个角色替换为3D人物,同时不改变视频中的其他场景和人物。 1530GitHub/AI开源# 模型
SuperTinyIcons一个收集了丰富 Logo的SVG 图标库,目前已收集386+ 个主流的品牌和产品的 Logo,包括GitHub、Twitter、Facebook等。适合用于网页设计、移动应用开发。 1230GitHub/AI开源插画/SVG
IP-Adapter-FaceID该模型利用面部识别模型的面部ID嵌入,可以更准确地捕捉和再现特定人物的面部特征。IP-Adapter-FaceID结合文本描述生成可以生成高度个性化且与原始面部特征一致的图像。 1140GitHub/AI开源
Awesome LangGraph一份精心整理的 LangGraph 资源合集,涵盖了基础介绍、入门模板、示例应用、实用工具等资源、以及整理一些如智能体、AI 助手、开发与工具、内容与媒体、知识与检索等优秀项目。 1220GitHub/AI开源
PDFMathTranslate一款开源的PDF文档翻译工具,专为翻译科技论文等PDF文件而设计。PDFMathTranslate能够完整保留原文的排版,包括公式和图表,并支持双语对照,保持原有目录结构。 1610AI-PDFGitHub/AI开源
Midscene.js一款基于AI的自动化浏览器助手,能够通过自然语言操作网页。你只需描述要执行的任务,Midscene.js会自动处理网页,如发推文、验证内容、搜索信息等功能。 1650GitHub/AI开源工作流/RPA
Linly-Dubbing一款开源的多语言AI配音和视频翻译工具。Linly-Dubbing可以自动将视频翻译成其他语言并生成字幕、克隆视频中说话者的声音并自动配音、进行口型同步。 1430GitHub/AI开源
SuperClaudeSuperClaude 是一个为 Claude Code 量身打造的零门槛编程的上下文工程开源框架。它通过一系列专门设计的命令、认知角色和开发方法,可以大大增强Claude Code 的能力。 1290AI编程GitHub/AI开源
Open WebUI一个可扩展、功能丰富且用户友好的自托管 WebUI,适用于各种 LLM 运行器,支持的 LLM 运行器包括 Ollama 和 OpenAI 兼容的 API。 1160GitHub/AI开源
NeuraPress/Markdown编辑器一款专注于微信公众号排版的Markdown编辑器,支持移动端,搭配DeepSeek和微信公众号助手,利用碎片化时间,通过手机就能编辑并发布带有排版效果的公众号文章。 1380GitHub/AI开源排版/分发
Klic StudioKrillin AI推出的视频翻译和配音工具,它支持100多种语言的翻译和配音,有AI同步口型、自然声音克隆功能,还能把音频/视频转成文字。 1680AI翻译GitHub/AI开源
Coze on WeChat一个基于微信平台开发的智能助手,主要对接 Coze 平台,支持大部分 Coze Bot 功能。它允许用户通过微信与 AI 聊天机器人进行交互,支持文本、语音等多种交互方式。 1440GitHub/AI开源智能体
BrowserOS一款基于 Chromium 内核带 AI 代理功能的浏览器,能自动完成在线购物、信息收集等多种网页操作。它支持本地 Ollama 模型,保护用户隐私。 1200GitHub/AI开源工作流/RPA
GenAI_Agents一个专注于生成式AI Agents技术的开源项目,GenAI_Agents提供从基础到高级的教程与实现代码,帮助开发者学习并构建智能、交互式的AI系统。 1750GitHub/AI开源
ExplorerTabUtility一款 Windows 11 资源管理器多标签扩展工具,它能把新窗口都改成标签页,还带快捷键操作,文件资源管理器用起来就像浏览器一样方便,标签页也能搜、能批量管。 1350GitHub/AI开源自媒体
IndexTTSB站基于XTTS和Tortoise开发的文本转语音模型,具备工业级零样本TTS能力。针对中文场景创新采用字符-拼音混合建模,可快速修正发音错误。 1720GitHub/AI开源文字&语音
Dual AI Chat一个聊天应用,核心设计是让两个不同风格的人工智能通过辩论协作生成回答。默认接入 Google Gemini API,同时兼容其他 OpenAI 标准的 API 接口,也支持本地模型或其他托管服务。 1380AI大模型GitHub/AI开源
Personalized Restoration一个面部图像精准恢复和个性编辑技术工具,不仅能复原受损图像细节,同时能精准捕捉和重现个人独特的面部特征。同时它还支持换脸。 1080GitHub/AI开源
Quick Prompt一个专注于提示词(Prompt)的管理和快速输入的浏览器扩展插件。可以帮助用户创建、管理和组织自己的提示词库,并在任何网页输入框中快速插入预设的提示词内容。 1370GitHub/AI开源谷歌插件
YouDub-Webui一款开源的多语言AI配音和视频翻译工具,优质视频中文化工具,YouDub-webui提供了一套完整的视频中文化工具包,涵盖了从视频下载、语音识别、字幕翻译、AI声音克隆、视频处理、自动上传等一系列流程。 1690GitHub/AI开源
ClotheDreamer一个虚拟试穿项目,可以从文本生成可穿戴3D 服装,ClotheDreamer是上海大学、上海交通大学、复旦大学和腾讯优图实验室出的。最佳服饰零售商 1100GitHub/AI开源
Maxun.dev一个无代码网页数据提取平台,可以可靠、大规模地从网站提取和自动化数据,能将任何网站转为实时数据馈送,Maxun.dev使用简便,不用编码,几分钟就可以上手。 1330GitHub/AI开源工作流/RPA