GitHub/AI开源

共 200 篇网址

中国大模型列表大全

中国大模型列表大全，全面收集有明确来源的大模型情况，包括机构、来源信息和分类等，随时更新。旨在记录中国大模型发展情况，欢迎在Issues中提供提供线索和素材。

1570

GitHub/AI开源

FUZZ

由Riffusion推出的一款基于扩散模型（Diffusion Model）的全新音乐生成模型，该工具能够通过“想象”生成音频的声谱图（Spectrogram），然后将其转换为音频。便携式音箱

1330

GitHub/AI开源

React-Tetris

一个用 React 框架开发的经典俄罗斯方块游戏。它用了组件化设计，能键盘控制，也能适配不同屏幕，既可以嵌入 React 应用，也能当独立组件用。

1170

GitHub/AI开源

QAnything AI

网易有道一个开源的本地知识库问答系统，旨在支持多种文件格式和数据库，允许离线安装和使用。 ,电子邮件(eml),TXT(txt),图像(jpg，jpeg，png),CSV(csv),网页链接(html)

1140

AI大模型 GitHub/AI开源 # 智能写作

PiliPala

一款基于Flutter开发的B站开源第三方客户端。支持Android和iOS平台，提供无广告的高清视频播放体验，具备倍速播放、离线缓存、稍后再看等功能。

1320

GitHub/AI开源自媒体

Automa

一款开源的低代码/无代码浏览器自动化工具，用户可以通过可视化界面，像搭积木一样将各种功能模块连接起来，构建自定义的自动化流程。

2300

GitHub/AI开源工作流/RPA

UIGEN-T1

一个基于 Qwen2.5-Coder-7B 模型微调的开源 UI 设计生成工具，能够根据用户输入的提示生成结构清晰且符合标准的 HTML 和 CSS 代码

1180

AI编程 GitHub/AI开源

AgentUniverse

一个面向复杂业务场景设计的多智能体协作框架，它提供了快速易用的大模型智能体应用搭建能力，以及丰富的多智能体协同模式组件。

1320

GitHub/AI开源智能体

Anda

一个以Rust为基础构建的AI智能体框架，整合了ICP区块链并且支持TEE环境，Anda的目标在于构建一个能够高度组合、自主运行且拥有持续记忆能力的AI智能体网络。

1190

GitHub/AI开源智能体

QuickRecorder

一款基于ScreenCapture Kit for macOS的轻量级录屏工具/基于 ScreenCapture Kit的多功能、轻量化、高性能的开源macOS屏幕录制工具。

1670

GitHub/AI开源

Documate

Documate是一款针对站内文档问答的开源 AI 工具，旨在将 AI 聊天对话框无缝嵌入到您的网站之中。

1220

GitHub/AI开源

Notebook Copilot

Notebook Copilot

有了 Notebook CoPilot，开发笔记本的过程变得更加容易。这个简单的工具可以毫不费力地根据您的输入生成代码和 Markdown 单元格，从而显着简化您的工作流程。

1020

GitHub/AI开源

Awesome-Ollama-Server

Awesome-Ollama-Server

一个用于实时监控和检测 Ollama 服务可用性和性能的系统。支持多语言，能够方便用户进行服务检测和性能监控。

1010

GitHub/AI开源

AutoGen

微软开发的一个开源框架，用于构建和管理基于LLM的多代理系统。它允许用户创建多个Agent，这些代理可以通过对话协作完成复杂的任务。

1450

GitHub/AI开源工作流/RPA

LiYing

一款证件照AI自动化处理神器，用于自动化处理证件照的程序，可在本地完全离线运行，适用于照相馆等场景，可以大大提升工作效率。

1720

AI证件照 GitHub/AI开源

StreamRAG

一个视频搜索和流媒体代理工具，能让您在 ChatGPT 中与您的视频库聊天并观看视频流。

1370

GitHub/AI开源

Eigent AI

全球首个桌面端多智能体生产力平台，采用多智能体协作架构，通过拆分任务、并行处理来提高复杂任务的执行效率，支持本地部署和云端运行，还有人类参与机制，能保证结果准确可靠。

1520

GitHub/AI开源 MCP

Awesome GPT-4o Images

Awesome GPT-4o Images

一个精选的GPT-4o生成图片集锦，收集了OpenAI 最新多模态模型 GPT‑4o 生成的精彩案例，展示其强大的文本‑图像理解与创作能力。

1040

GitHub/AI开源

ReactBits

一个免费开源的动画化、可交互React组件库，里面有好多动画化、能交互而且可以随便改的 React 组件，能用来做出特别好看的用户界面。

1870

GitHub/AI开源

HiDiffusion

大幅提升扩散模型的图像生成质速度提升6倍，由字节跳动的研究团队开发，只需添加一行代码即可

1130

GitHub/AI开源

FlyCut Caption

一款开源的视频字幕编辑工具，支持智能生成字幕、编辑字幕和裁剪视频。它通过语音识别生成字幕，你可以直接编辑字幕来剪辑视频。

1560

GitHub/AI开源字幕 # 字幕

ToonComposer

腾讯推出的AI自动上色和生成动画工具，它能将动画制作里“补帧”和“上色”这两个步骤合并成“生成后原画”阶段，让动画制作流程变得更简单。

1420

GitHub/AI开源

LangBot

一个开源大模型原生即时通信机器人平台，支持多平台（如微信、飞书等）和多种大语言模型（如 ChatGPT、DeepSeek等)，具备多模态交互能力。

1400

GitHub/AI开源

ValueCell AI

全球首个开源金融智能体平台，采用社区驱动和多智能体模式，ValueCell提供选股、分析、新闻推送、市场研究、数据收集、情绪分析、策略生成等功能。

1540

GitHub/AI开源

Ncurator/馆长

知识库AI问答助手，让AI帮助你整理与分析知识，馆长基于语义和关键词搜索技术，当你输入问题时，馆长智能分析你的查询，并从你的知识库中检索出最相关的信息。

1440

GitHub/AI开源 # AI # GPT

DreamTalk

一个由清华大学、阿里巴巴和华中科大共同开发的一个基于扩散模型可以让人物照片说话，支持包括歌曲、多种语言的语音、嘈杂的音频在内的各种声音匹配让人物头像说话的框架。

1190

GitHub/AI开源

HandRefiner

解决AI图像生成中手部畸形的问题目前的图像生成模型，再生成图像方面已经非常出色，但在生成人类手部的图像时却常常出现问题，比如手指数量不对或者手形怪异。

1000

GitHub/AI开源

Animagine XL 3.1

Animagine XL 3.1

一个开源的文本生成图像动漫模型，通过整合新的数据集，Animagine XL 3.1扩展了对广泛动漫作品和风格的理解，从经典作品到最新发布的动漫，覆盖了从古老到现代的各种艺术风格。

1170

GitHub/AI开源

Platon.AI – 柏拉图智能

Platon.AI – 柏拉图智能

Platon.AI柏拉图智能不仅仅是 AI 爬虫，也是 AI agents 的基础设施。 AI agents 要使用工具，就必须高速阅读理解在线网页，理解网页上的每一个元素——这就是 platon.AI 的技术。

1290

GitHub/AI开源

DuckDB-NSQL

一个专门为DuckDB数据库设计的文本到SQL的模型，你可以使用自然语言说描述你的需求，它会自动转换成SQL代码。

1110

GitHub/AI开源

Sora.FM

一个使用nextjs创建的用于生成 Sora AI视频的开源Web模板。

1120

GitHub/AI开源

VideoDrafter

一个高质量视频生成的开放式扩散模型，相比之前的生成视频模型，VideoDrafter最大的特点是能在主体不变的基础上，一次性生成多个场景的视频。

1100

GitHub/AI开源

LiveSketch

LiveSketch是一款AI生成视频工具，用户通过文本提示将静态素描转化为动画，它提供了一种简单直观的方法，使他们的素描变得生动活泼。

1400

GitHub/AI开源 # Text-to-Video

TryOnDiffusion

TryOnDiffusion就谷歌推出的一项新虚拟试穿功能，能够实现高度逼真的虚拟试穿，用户能够直观地看到不同体型的人穿着不同尺寸的衣服效果如何。

1190

GitHub/AI开源

WeChat Bot

基于WeChaty结合OpenAI ChatGPT、Kimi、讯飞等多种AI服务实现的开源微信机器人项目，用于自动回复微信消息或管理微信群/好友。

1700

GitHub/AI开源自媒体

ChopperBot

一款能用于像虎牙、斗鱼、抖音、BiliBili、TikTok、Twitch 等平台的智能直播视频剪辑发布工具，能实现自动化视频剪辑和自动化切片操作，而且非常智能。

1670

GitHub/AI开源工作流/RPA

Windrecorder

捕风记录仪，一款开源的屏幕录制与检索工具，它记录屏幕内容来实现记忆搜索，帮用户检索记忆线索，支持按OCR文本或画面描述查询，还提供活动统计等功能。

1180

GitHub/AI开源

Motionshop

AI角色动画工具，通过先进的视频处理和3D渲染技术，MotionShop能够高效地将视频中的某个角色替换为3D人物，同时不改变视频中的其他场景和人物。

1530

GitHub/AI开源 # 模型

Pydantic AI

一个Pydantic 团队开发的Python代理框架，可以通过生成式AI轻松构建生产级应用程序。

1120

AI编程 GitHub/AI开源

SuperTinyIcons

一个收集了丰富 Logo的SVG 图标库，目前已收集386+ 个主流的品牌和产品的 Logo，包括GitHub、Twitter、Facebook等。适合用于网页设计、移动应用开发。

1230

GitHub/AI开源插画/SVG

IP-Adapter-FaceID

IP-Adapter-FaceID

该模型利用面部识别模型的面部ID嵌入，可以更准确地捕捉和再现特定人物的面部特征。IP-Adapter-FaceID结合文本描述生成可以生成高度个性化且与原始面部特征一致的图像。

1140

GitHub/AI开源

Cody Former

一个开源的人工智能图像处理工具，Cody Former专注于面部修复、图片清晰化以及视频去除马赛克和修复。

1260

GitHub/AI开源

DemoFusion

一个开源的 AI 图像重绘增强工具，通过使用最新的 BSR Gan技术，可以将低分辨率图像提升至高分辨率并修复和增强图像的细节。

1140

GitHub/AI开源

Awesome LangGraph

Awesome LangGraph

一份精心整理的 LangGraph 资源合集，涵盖了基础介绍、入门模板、示例应用、实用工具等资源、以及整理一些如智能体、AI 助手、开发与工具、内容与媒体、知识与检索等优秀项目。

1220

GitHub/AI开源

NativeMind

一款开源的本地化AI助手浏览器插件，支持Ollama和WebLLM两种本地模型，全部数据处理都在本地完成，有效保护用户隐私。

1550

GitHub/AI开源谷歌插件

DUIX

硅基智能打造的AI数字人智能交互平台。通过将数字人交互能力开源，开发者可自行接入多方大模型、语音识别（ASR）、语音合成（TTS）能力，实现数字人实时交互。

1480

GitHub/AI开源

Omnivore

一款免费、开源、适合认真阅读的稍后阅读应用程序。不受干扰。注重隐私。开源。专为知识工作者和终身学习者而设计。

1540

GitHub/AI开源

APISR

一个专注于动漫图像超分辨率的项目，旨在恢复和增强来自现实世界场景的低质量、低分辨率动漫图像和视频源。

1420

GitHub/AI开源

Jan.ai

ChatGPT 的开源、托管替代品，jan.ai可在您的计算机上100%离线运行。

1780

GitHub/AI开源 # LLM

PDFMathTranslate

PDFMathTranslate

一款开源的PDF文档翻译工具，专为翻译科技论文等PDF文件而设计。PDFMathTranslate能够完整保留原文的排版，包括公式和图表，并支持双语对照，保持原有目录结构。

1610

AI-PDF GitHub/AI开源

Midscene.js

一款基于AI的自动化浏览器助手，能够通过自然语言操作网页。你只需描述要执行的任务，Midscene.js会自动处理网页，如发推文、验证内容、搜索信息等功能。

1650

GitHub/AI开源工作流/RPA

TextBase

TextBase 是一款简单的框架，用于构建 AI 聊天机器人，它可以帮助开发人员快速搭建和优化聊天机器人。

1270

GitHub/AI开源

Simba

一个能够帮助用户轻松收纳各种文档的强大工具，Simba可以作为一个后端知识库与任何检索增强生成（RAG）系统进行无缝集成。

1200

GitHub/AI开源

Diffutoon

一项突破性的卡通着色进步，植根于扩散模型，通过解决四个子问题：风格化、一致性增强、结构指导和着色，将逼真的视频转变为动漫风格。

1590

GitHub/AI开源

libcom

上海交通大学牛力教授团队推出的一款图像合成工具箱，经过六年的研发，集成了多种强大的图像处理功能。

1210

GitHub/AI开源

MimicMotion

腾讯和上交大出的，具有置信度感知姿势指导的高质量人体运动视频生成，MimicMotion可以生成任意长度、具有任何动作指导的高质量视频生成框架。

1460

GitHub/AI开源

Linly-Dubbing

一款开源的多语言AI配音和视频翻译工具。Linly-Dubbing可以自动将视频翻译成其他语言并生成字幕、克隆视频中说话者的声音并自动配音、进行口型同步。

1430

GitHub/AI开源

Proxy

Convergence Ai开发的基于LMLM的个人AI智能体，Proxy具备自动化浏览Web的能力，能够通过自然语言交互来帮助用户完成各种日常任务。

1180

GitHub/AI开源

Presenton

一个可以本地运行的开源AI PPT生成器，使用OpenAI、Gemini或Ollama等模型，确保数据隐私和控制。

1530

AI-PPT GitHub/AI开源

Tarsier

字节跳动推出的一系列大规模视觉语言模型（LVLM），专注于视频理解任务，包括视频描述、问答、视频定位、幻觉测试等功能。

1130

GitHub/AI开源

SuperClaude

SuperClaude 是一个为 Claude Code 量身打造的零门槛编程的上下文工程开源框架。它通过一系列专门设计的命令、认知角色和开发方法，可以大大增强Claude Code 的能力。

1290

AI编程 GitHub/AI开源

AnimateDiff

AnimateDiff 是一个能够将个性化的文本转换为图像的扩展模型，一款可以在stable diffusion中制作稳定gif动图的插件。

1230

GitHub/AI开源

Perplexica

一个提供高质量搜索体验的开源AI驱动搜索引擎，Perplexica通过理解用户问题并利用机器学习算法来提供精准的搜索结果。

1360

GitHub/AI开源

Lumiere

谷歌研究院开发的基于空间时间的文本到视频扩散模型。采用了创新的空间时间U-Net架构，能够一次性生成整个视频的时间长度，确保了生成视频的连贯性和逼真度。

1400

GitHub/AI开源

AingDesk

一款简单好用的AI助手，可以简化AI模型的本地部署和管理，支持多种AI模型的一键部署、联网搜索、模型共享等功能。

1330

GitHub/AI开源

VideoFusion

一款开源、免费的批量化视频处理工具，自动去黑边,视频合并,AI降噪,视频压缩,无需繁杂操作，轻轻点击,应有尽有。

1670

GitHub/AI开源

Open WebUI

一个可扩展、功能丰富且用户友好的自托管 WebUI，适用于各种 LLM 运行器，支持的 LLM 运行器包括 Ollama 和 OpenAI 兼容的 API。

1160

GitHub/AI开源

Workout.cool

一个免费开源的健身指导平台，拥有全面的锻炼数据库，主要用来帮用户制定训练计划、记录锻炼进度，还能查大量训练动作和获取详细的锻炼指导和视频演示。

1280

GitHub/AI开源

NeuraPress/Markdown编辑器

NeuraPress/Markdown编辑器

一款专注于微信公众号排版的Markdown编辑器，支持移动端，搭配DeepSeek和微信公众号助手，利用碎片化时间，通过手机就能编辑并发布带有排版效果的公众号文章。

1380

GitHub/AI开源排版/分发

长亭百智云

The most open-minded community to make you a product manager too

1510

AI编程 GitHub/AI开源

MetaGPT

The Multi-Agent Framework

1600

AI大模型 GitHub/AI开源

Wiseflow

一款敏捷的信息挖掘开源免费工具，Wiseflow可以从网站、微信公众号、社交平台等各种信息源中按设定的关注点提炼讯息，自动做标签归类并上传数据库。

1490

GitHub/AI开源

MotionAgent一站式视频生成工具

MotionAgent一站式视频生成工具

MotionAgent 集成了大语言模型、文本生成图片模型、视频生成模型和音乐生成模型。

1000

GitHub/AI开源

Klic Studio

Krillin AI推出的视频翻译和配音工具，它支持100多种语言的翻译和配音，有AI同步口型、自然声音克隆功能，还能把音频/视频转成文字。

1680

AI翻译 GitHub/AI开源

Coze on WeChat

一个基于微信平台开发的智能助手，主要对接 Coze 平台，支持大部分 Coze Bot 功能。它允许用户通过微信与 AI 聊天机器人进行交互，支持文本、语音等多种交互方式。

1440

GitHub/AI开源智能体

Diffuse to Choose

Diffuse to Choose

一种基于扩散的图像修复模型，主要用于虚拟试穿场景。它能够在修复图像时保留参考物品的细节，适用于在线购物等虚拟试穿场景中的图像修复任务。

1320

GitHub/AI开源

BrowserOS

一款基于 Chromium 内核带 AI 代理功能的浏览器，能自动完成在线购物、信息收集等多种网页操作。它支持本地 Ollama 模型，保护用户隐私。

1200

GitHub/AI开源工作流/RPA

LinkedIn_AIHawk

LinkedIn_AIHawk

您的人工智能求职助手。自动化申请、LinkedIn_AIHawk让你获得个性化建议并更快地找到您梦想的工作。

1080

GitHub/AI开源

WhisperFusion

一个基于WhisperLive把声音转文字和WhisperSpeech理解这些文字的能力构建。能够与AI聊天机器人进行超低延迟对话。

1110

GitHub/AI开源

DreaMoving

DreaMoving，一种基于扩散的可控视频生成框架，用于生成高质量的定制人类舞蹈视频。

1230

GitHub/AI开源

GenAI_Agents

一个专注于生成式AI Agents技术的开源项目，GenAI_Agents提供从基础到高级的教程与实现代码，帮助开发者学习并构建智能、交互式的AI系统。

1750

GitHub/AI开源

ExplorerTabUtility

ExplorerTabUtility

一款 Windows 11 资源管理器多标签扩展工具，它能把新窗口都改成标签页，还带快捷键操作，文件资源管理器用起来就像浏览器一样方便，标签页也能搜、能批量管。

1350

GitHub/AI开源自媒体

JoyGen

京东科技与香港大学合作开发的音频驱动3D说话人脸视频生成框架，提供精确的唇部与音频同步，以精确模拟说话者的唇部动作和面部表情，让生成的视频更逼真。

1360

GitHub/AI开源

IDM-VTON

一种先进的虚拟试穿技术，它通过结合视觉编码器和UNet模型来生成高质量的虚拟试穿图像，并且可以通过定制来进一步提高图像的一致性和真实性。

1030

GitHub/AI开源

DDColor图像上色

一个为黑白图像上色的魔搭模型，通过双解码器实现逼真的图像着色，输入一张黑白图像，实现端到端的全图上色，返回上色处理后的彩色图像。

1410

GitHub/AI开源调色配色 # 模型

Colors

一个开源的学术期刊配色推荐器，收集整理了众多高质量论文插图的配色，可帮助我们轻松快速找到专业水准的配色组合。

1580

GitHub/AI开源调色配色

CodeFormer

CodeFormer开源盲人脸修复框架，支持老照片修复、人脸增强、颜色化、局部修复与视频增强。

4650

GitHub/AI开源

IndexTTS

B站基于XTTS和Tortoise开发的文本转语音模型，具备工业级零样本TTS能力。针对中文场景创新采用字符-拼音混合建模，可快速修正发音错误。

1720

GitHub/AI开源文字&语音

DeepFaceLab

DeepFaceLab 是一种利用深度学习识别来交换图片和视频中的人脸的工具。

1720

GitHub/AI开源

Dual AI Chat

一个聊天应用，核心设计是让两个不同风格的人工智能通过辩论协作生成回答。默认接入 Google Gemini API，同时兼容其他 OpenAI 标准的 API 接口，也支持本地模型或其他托管服务。

1380

AI大模型 GitHub/AI开源

Personalized Restoration

Personalized Restoration

一个面部图像精准恢复和个性编辑技术工具，不仅能复原受损图像细节，同时能精准捕捉和重现个人独特的面部特征。同时它还支持换脸。

1080

GitHub/AI开源

SurveyX

一个利用大型语言模型（LLMs）生成高质量、特定领域学术论文和调查的先进学术调查自动化系统。

1200

AI大模型 GitHub/AI开源

TokenFlow

一个利用预训练的文本到图像扩散模型进行视频编辑的框架。它无需进一步训练或微调，即可实现一致的视频编辑效果。

1260

GitHub/AI开源

Quick Prompt

一个专注于提示词（Prompt）的管理和快速输入的浏览器扩展插件。可以帮助用户创建、管理和组织自己的提示词库，并在任何网页输入框中快速插入预设的提示词内容。

1370

GitHub/AI开源谷歌插件

YouDub-Webui

一款开源的多语言AI配音和视频翻译工具，优质视频中文化工具，YouDub-webui提供了一套完整的视频中文化工具包，涵盖了从视频下载、语音识别、字幕翻译、AI声音克隆、视频处理、自动上传等一系列流程。

1690

GitHub/AI开源

ClotheDreamer

一个虚拟试穿项目，可以从文本生成可穿戴3D 服装，ClotheDreamer是上海大学、上海交通大学、复旦大学和腾讯优图实验室出的。最佳服饰零售商

1100

GitHub/AI开源

Awesome-Nano-Banana

Awesome-Nano-Banana

JimmyLv创建的GitHub仓库，专门收集和展示Google的Nano Banana模型生成的图片和提示词。

1160

GitHub/AI开源

Caesium

一款免费的开源在线图像压缩工具，Caesium支持JPG、PNG等格式的批量处理和预览功能。能将照片压缩至原始大小的90%。

1510

GitHub/AI开源

Maxun.dev

一个无代码网页数据提取平台，可以可靠、大规模地从网站提取和自动化数据，能将任何网站转为实时数据馈送，Maxun.dev使用简便，不用编码，几分钟就可以上手。

1330

GitHub/AI开源工作流/RPA

AniPortrait

一款由腾讯研究人员开发的音频驱动的肖像动画合成框架，AniPortrait能够根据音频和静态人脸图片生成逼真的动态视频。

1090

GitHub/AI开源