GitHub/AI开源

共 200 篇网址

长亭百智云

The most open-minded community to make you a product manager too

1510

AI编程 GitHub/AI开源

CodeFormer

CodeFormer开源盲人脸修复框架，支持老照片修复、人脸增强、颜色化、局部修复与视频增强。

4650

GitHub/AI开源

n8n

开源AI与工作流自动化平台，通过可视节点与自定义代码连接应用服务实现智能自动化。

1780

AI大模型 GitHub/AI开源 # 开发工具

PPTist

PPTist是一款基于Vue3、Canvas及TypeScript构建的开源在线演示文稿（PPT）编辑器，旨在提供与桌面端一致的流畅办公体验。

3.7K0

GitHub/AI开源

卡卡字幕助手 | VideoCaptioner

卡卡字幕助手 | VideoCaptioner

一款基于 LLM 的智能字幕助手，无需GPU一键高质量字幕视频合成！支持生成、断句、优化、翻译全流程。卡卡字幕助手让视频字幕制作简单高效！优化、翻译，字幕视频全流程一键处理！

1560

GitHub/AI开源字幕 # 字幕

Video-Subtitle-Master

Video-Subtitle-Master

一个用于批量为视频生成字幕的客户端开源工具，并支持将字幕翻译成其他语言。

1290

GitHub/AI开源字幕 # 字幕

SmythOS

一个开源的AI操作系统，支持用户在90秒内通过聊天提示快速创建AI代理。它提供可视化工作流、API调用、分类器等功能。

1420

GitHub/AI开源工作流/RPA

NeuraPress/Markdown编辑器

NeuraPress/Markdown编辑器

一款专注于微信公众号排版的Markdown编辑器，支持移动端，搭配DeepSeek和微信公众号助手，利用碎片化时间，通过手机就能编辑并发布带有排版效果的公众号文章。

1380

GitHub/AI开源排版/分发

FlyCut Caption

一款开源的视频字幕编辑工具，支持智能生成字幕、编辑字幕和裁剪视频。它通过语音识别生成字幕，你可以直接编辑字幕来剪辑视频。

1560

GitHub/AI开源字幕 # 字幕

ChopperBot

一款能用于像虎牙、斗鱼、抖音、BiliBili、TikTok、Twitch 等平台的智能直播视频剪辑发布工具，能实现自动化视频剪辑和自动化切片操作，而且非常智能。

1670

GitHub/AI开源工作流/RPA

BrowserOS

一款基于 Chromium 内核带 AI 代理功能的浏览器，能自动完成在线购物、信息收集等多种网页操作。它支持本地 Ollama 模型，保护用户隐私。

1200

GitHub/AI开源工作流/RPA

ExplorerTabUtility

ExplorerTabUtility

一款 Windows 11 资源管理器多标签扩展工具，它能把新窗口都改成标签页，还带快捷键操作，文件资源管理器用起来就像浏览器一样方便，标签页也能搜、能批量管。

1350

GitHub/AI开源自媒体

AI看线（AI-Kline）

一个结合K线图，技术指标，财务数据，新闻数据的AI股票分析及预测框架，利用AI对股票市场进行深入分析。

1740

AI分析总结 GitHub/AI开源

PiliPala

一款基于Flutter开发的B站开源第三方客户端。支持Android和iOS平台，提供无广告的高清视频播放体验，具备倍速播放、离线缓存、稍后再看等功能。

1320

GitHub/AI开源自媒体

Memento

一款基于mpv构建的开源视频播放器，专为学习日语设计。它巧妙地将视频播放与语言学习功能结合，支持通过影视内容进行语法分析、生词捕捉和记忆卡片制作。

1240

GitHub/AI开源自媒体

WeChat Bot

基于WeChaty结合OpenAI ChatGPT、Kimi、讯飞等多种AI服务实现的开源微信机器人项目，用于自动回复微信消息或管理微信群/好友。

1700

GitHub/AI开源自媒体

SuperTinyIcons

一个收集了丰富 Logo的SVG 图标库，目前已收集386+ 个主流的品牌和产品的 Logo，包括GitHub、Twitter、Facebook等。适合用于网页设计、移动应用开发。

1230

GitHub/AI开源插画/SVG

DDColor图像上色

一个为黑白图像上色的魔搭模型，通过双解码器实现逼真的图像着色，输入一张黑白图像，实现端到端的全图上色，返回上色处理后的彩色图像。

1410

GitHub/AI开源调色配色 # 模型

MagicColor

香港科技大学团开发的首个支持单次前向传播多实例集成的线稿上色框架，用户仅需上传一张黑白线稿和若干参考图像，系统便能在数秒内自动完成精准且自然的色彩填充。

1420

GitHub/AI开源文/图生图

Colors

一个开源的学术期刊配色推荐器，收集整理了众多高质量论文插图的配色，可帮助我们轻松快速找到专业水准的配色组合。

1580

GitHub/AI开源调色配色

PDF补丁丁|PDFPatcher

PDF补丁丁|PDFPatcher

PDFPatcher，是国内开发者wmjordan用.NET框架开发的PDF工具，能帮咱们处理日常办公、学习和整理文档时遇到的PDF问题。

1250

AI-PDF GitHub/AI开源

VideoFusion

一款开源、免费的批量化视频处理工具，自动去黑边,视频合并,AI降噪,视频压缩,无需繁杂操作，轻轻点击,应有尽有。

1670

GitHub/AI开源

AutoClip

一款AI智能视频切片工具，能自动下载B站视频、剪辑精彩片段并生成合集，适合播客、直播、讲解等内容的切片。

2230

GitHub/AI开源

Caesium

一款免费的开源在线图像压缩工具，Caesium支持JPG、PNG等格式的批量处理和预览功能。能将照片压缩至原始大小的90%。

1510

GitHub/AI开源

Quick Prompt

一个专注于提示词（Prompt）的管理和快速输入的浏览器扩展插件。可以帮助用户创建、管理和组织自己的提示词库，并在任何网页输入框中快速插入预设的提示词内容。

1370

GitHub/AI开源谷歌插件

Ncurator/馆长

知识库AI问答助手，让AI帮助你整理与分析知识，馆长基于语义和关键词搜索技术，当你输入问题时，馆长智能分析你的查询，并从你的知识库中检索出最相关的信息。

1440

GitHub/AI开源 # AI # GPT

Awesome LLM Apps

Awesome LLM Apps

一个精选的LLM（大型语言模型）应用集合，汇集了使用OpenAI、Anthropic、Google、Gemini以及开源模型（如DeepSeek、Qwen或Llama）构建的LLM应用。

1350

GitHub/AI开源

GenAI_Agents

一个专注于生成式AI Agents技术的开源项目，GenAI_Agents提供从基础到高级的教程与实现代码，帮助开发者学习并构建智能、交互式的AI系统。

1750

GitHub/AI开源

Awesome MCP Servers

一个精心整理的 MCP 服务器资源列表，汇集了各种实现 MCP 协议的服务器，使 AI 模型能够安全地与本地及远程资源进行交互。

1200

GitHub/AI开源

LLM Engineer Toolkit

LLM Engineer Toolkit

一个精心整理的LLM 工具库，它将120多个与LLM相关的库按照功能和用途进行了细致分类，涵盖了从训练微调、应用开发、推理服务到安全评估等 LLM 开发全流程所需的工具。

1330

GitHub/AI开源

Awesome LangGraph

Awesome LangGraph

一份精心整理的 LangGraph 资源合集，涵盖了基础介绍、入门模板、示例应用、实用工具等资源、以及整理一些如智能体、AI 助手、开发与工具、内容与媒体、知识与检索等优秀项目。

1220

GitHub/AI开源

Build Your Own X

一个帮助开发者提升编程能力的开源项目，Build Your Own X提供了丰富的教程和资源，用户通过从零开始重新实现各种技术（如Web服务器、数据库、操作系统等）。

1250

GitHub/AI开源

Awesome Chinese LLM

Awesome Chinese LLM

整理了开源的中文大语言模型（LLM），主要关注规模较小、可私有化部署且训练成本较低的模型，目前已收录了100多个相关资源。

1310

GitHub/AI开源

Awesome MCP ZH

一个专为中文用户打造的 MCP资源合集！包括有 MCP 的基础介绍、玩法、客户端、服务器和社区资源，帮你快速上手这个 AI 界的“万能插头”。

1210

GitHub/AI开源

Awesome GPT-4o Images

Awesome GPT-4o Images

一个精选的GPT-4o生成图片集锦，收集了OpenAI 最新多模态模型 GPT‑4o 生成的精彩案例，展示其强大的文本‑图像理解与创作能力。

1040

GitHub/AI开源

LLM Course

一个关于LLMs课程的集合，包含学习路线图和Colab笔记本，帮助用户从基础到高级逐步掌握LLMs的知识和应用。

1160

GitHub/AI开源

DeepSeek官方工具箱

由 DeepSeek官方团队维护的开源项目，提供与 DeepSeek API 集成的各种工具和资源，应用程序、AI Agent 框架、RAG 框架、浏览器插件、VS Code 插件等。

1460

GitHub/AI开源

Documate

Documate是一款针对站内文档问答的开源 AI 工具，旨在将 AI 聊天对话框无缝嵌入到您的网站之中。

1220

GitHub/AI开源

AI Comic Factory

AI Comic Factory

AI Comic Factory是一个免费开源的AI漫画生成器，使用LLM + SDXL开发。它能够根据用户提供的提示词生成漫画，并支持无损放大、保存和打印。

1510

GitHub/AI开源

EmojiGen

EmojiGen是一个开源的表情符号生成器。用户只需要在输入框中输入一个词或短语，EmojiGen就会立即生成相关的表情符号。

1220

GitHub/AI开源

Platon.AI – 柏拉图智能

Platon.AI – 柏拉图智能

Platon.AI柏拉图智能不仅仅是 AI 爬虫，也是 AI agents 的基础设施。 AI agents 要使用工具，就必须高速阅读理解在线网页，理解网页上的每一个元素——这就是 platon.AI 的技术。

1290

GitHub/AI开源

Jan.ai

ChatGPT 的开源、托管替代品，jan.ai可在您的计算机上100%离线运行。

1780

GitHub/AI开源 # LLM

Chatbot UI

一个开源的聊天机器人Web UI框架，Chatbot UI提供 OpenAI 的 ChatGPT UI 的改进版本。提供了一个简单的用户界面，具有新对话、新聊天、导入数据、导出数据、设置和插件键等功能。

1280

GitHub/AI开源

Sora.FM

一个使用nextjs创建的用于生成 Sora AI视频的开源Web模板。

1120

GitHub/AI开源

Magi

为您喜欢的漫画生成文字记录，将文本与说话者相匹配，从而使读者能够通过阅读文本来完整地体验漫画故事。选购畅销商品

1220

GitHub/AI开源

APISR

一个专注于动漫图像超分辨率的项目，旨在恢复和增强来自现实世界场景的低质量、低分辨率动漫图像和视频源。

1420

GitHub/AI开源

PDF-Guru

一个通用型PDF文件处理工具，PDF-Guru包含PDF合并、拆分、旋转、水印、加密、转换等20多项常用功能，完全开源，个人免费使用，界面简洁，简单易用。

1540

GitHub/AI开源

Cody Former

一个开源的人工智能图像处理工具，Cody Former专注于面部修复、图片清晰化以及视频去除马赛克和修复。

1260

GitHub/AI开源

MindSearch

一个开源的 AI 搜索引擎框架，MindSearch具有与 Perplexity.ai Pro 相同的性能。您可以轻松部署它来构建您自己的搜索引擎。

1140

GitHub/AI开源

LabelLLM

一个开源的数据标注平台，致力于优化对于大型语言模型（LLM）开发不可或缺的数据标注过程。

1130

GitHub/AI开源

LabelU

一个开源的数据标注工具，可以帮助用户快速、准确、高效地对数据进行标注，从而提高机器学习模型的性能和质量。

1270

GitHub/AI开源

YouDub-Webui

一款开源的多语言AI配音和视频翻译工具，优质视频中文化工具，YouDub-webui提供了一套完整的视频中文化工具包，涵盖了从视频下载、语音识别、字幕翻译、AI声音克隆、视频处理、自动上传等一系列流程。

1690

GitHub/AI开源

RMBG-2.0

BRIA AI开发的开源图像背景移除模型，RMBG-2.0基于创新的BiRefNet架构，能够在复杂环境和高细节图像中提供高精度的背景去除。

1180

GitHub/AI开源

FireRedASR

小红书FireRed 团队发布并开源的基于大模型的语音识别模型，它在中文普通话语音识别领域取得了新的SOTA，FireRedASR支持方言、英语及歌词识别。

1300

GitHub/AI开源

Proxy

Convergence Ai开发的基于LMLM的个人AI智能体，Proxy具备自动化浏览Web的能力，能够通过自然语言交互来帮助用户完成各种日常任务。

1180

GitHub/AI开源

DragGAN

通过DragGAN，任何人都可以通过精确控制像素的位置来变形图像，从而操纵不同类别的姿势、形状、表情和布局。

1220

GitHub/AI开源

TryOnDiffusion

TryOnDiffusion就谷歌推出的一项新虚拟试穿功能，能够实现高度逼真的虚拟试穿，用户能够直观地看到不同体型的人穿着不同尺寸的衣服效果如何。

1190

GitHub/AI开源

MotionAgent一站式视频生成工具

MotionAgent一站式视频生成工具

MotionAgent 集成了大语言模型、文本生成图片模型、视频生成模型和音乐生成模型。

1000

GitHub/AI开源

MagicEdit

MagicEdit 是字节跳动的一款视频编辑工具，它可以高保真度和时间连贯性地编辑视频，通过学习明确区分外观和动作。

1370

GitHub/AI开源

DeepFaceLab

DeepFaceLab 是一种利用深度学习识别来交换图片和视频中的人脸的工具。

1720

GitHub/AI开源

TextBase

TextBase 是一款简单的框架，用于构建 AI 聊天机器人，它可以帮助开发人员快速搭建和优化聊天机器人。

1270

GitHub/AI开源

AIdea

AIdea 是一款支持 GPT 以及国产大语言模型通义千问、文心一言等，支持 Stable Diffusion 文生图、图生图、 SDXL1.0、超分辨率、图片上色的全能型完全开源APP。

1120

GitHub/AI开源

Whisper语音识别模型

Whisper 是一种通用的语音识别模型。它在不同音频的大型数据集上进行训练，也是一个多任务模型，可以执行多语言语音识别以及语音翻译和语言识别。

1410

AI大模型 GitHub/AI开源

FaceChain

FaceChain是一个可以用来打造个人数字形象的深度学习模型工具。用户仅需要提供最低一张照片即可获得独属于自己的个人形象数字替身。

1280

GitHub/AI开源

AI Companion App

AI Companion App

AI Companion App，一键创建和训练属于你的AI伴侣/女朋友。

1200

GitHub/AI开源

EasyPhoto

EasyPhoto是一个用于生成AI肖像的Webui UI插件，可以用来训练与你相关的数字化替身。

1090

GitHub/AI开源

ProPainter

ProPainter，一键移除视频内的移动物体，一键移除视频水印。

1420

GitHub/AI开源

DeepFaceLive

DeepFaceLive是一款基于人工智能的面部合成技术，它可以将一个人的面部表情和动作合成到另一个人的脸上，从而实现非常逼真的面部合成效果。

1440

GitHub/AI开源

AnimateDiff

AnimateDiff 是一个能够将个性化的文本转换为图像的扩展模型，一款可以在stable diffusion中制作稳定gif动图的插件。

1230

GitHub/AI开源

CustomNet

CustomNet旨在更好地将指定物品的图片融合到新生成的图片中，并确保原物品的样式和纹理细节得以还原。这项技术给SD商品图融合带来了一线生机。

1120

GitHub/AI开源

易魔声EmotiVoice

易魔声EmotiVoice是一个强大的开源TTS引擎，支持中英文双语，包含2000多种不同的音色，以及特色的情感合成功能，支持合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音。

1240

GitHub/AI开源

Notebook Copilot

Notebook Copilot

有了 Notebook CoPilot，开发笔记本的过程变得更加容易。这个简单的工具可以毫不费力地根据您的输入生成代码和 Markdown 单元格，从而显着简化您的工作流程。

1020

GitHub/AI开源

VideoSrt

VideoSrt是一个可以识别视频语音自动生成字幕 SRT文件的开源软件工具。适用于快速、批量的为媒体（视频/音频）生成中/英文字幕、文本文件的业务场景。

1630

GitHub/AI开源

Deepfakes Creator

Deepfakes Creator

Deepfakes Creator，可以通过文本输入生成逼真的会说话的真人视频。用户只需要上传想要化身模仿的人的照片，并写一个剧本，工具就能创建出逼真的人物化身视频，模拟人物说话。

1470

GitHub/AI开源

InvokeAI

InvokeAI 是一个开源项目，是 Stable Diffusion 模型的领先创意引擎，它为使用 Stable Diffusion 模型生成高质量图像提供了简化的过程。

1120

GitHub/AI开源

LiveSketch

LiveSketch是一款AI生成视频工具，用户通过文本提示将静态素描转化为动画，它提供了一种简单直观的方法，使他们的素描变得生动活泼。

1400

GitHub/AI开源 # Text-to-Video

LucidDreamer

LucidDreamer，可以从单个图像的单个文本提示中生成可导航的3D场景。单击并拖动（导航）/移动和滚动（缩放）以感受3D。

1240

GitHub/AI开源

DreaMoving

DreaMoving，一种基于扩散的可控视频生成框架，用于生成高质量的定制人类舞蹈视频。

1230

GitHub/AI开源

ComfyUI Portrait Master简体中文版

ComfyUI Portrait Master简体中文版

ComfyUI Portrait Master 肖像大师简体中文版。超详细参数设置!再也不用为不会写人像提示词发愁!重新优化为ison列表更方便自定义和扩展。

1210

GitHub/AI开源

DemoFusion

一个开源的 AI 图像重绘增强工具，通过使用最新的 BSR Gan技术，可以将低分辨率图像提升至高分辨率并修复和增强图像的细节。

1140

GitHub/AI开源

HandRefiner

解决AI图像生成中手部畸形的问题目前的图像生成模型，再生成图像方面已经非常出色，但在生成人类手部的图像时却常常出现问题，比如手指数量不对或者手形怪异。

1000

GitHub/AI开源

DreamTalk

一个由清华大学、阿里巴巴和华中科大共同开发的一个基于扩散模型可以让人物照片说话，支持包括歌曲、多种语言的语音、嘈杂的音频在内的各种声音匹配让人物头像说话的框架。

1190

GitHub/AI开源

VideoDrafter

一个高质量视频生成的开放式扩散模型，相比之前的生成视频模型，VideoDrafter最大的特点是能在主体不变的基础上，一次性生成多个场景的视频。

1100

GitHub/AI开源

IP-Adapter-FaceID

IP-Adapter-FaceID

该模型利用面部识别模型的面部ID嵌入，可以更准确地捕捉和再现特定人物的面部特征。IP-Adapter-FaceID结合文本描述生成可以生成高度个性化且与原始面部特征一致的图像。

1140

GitHub/AI开源

Audio2Photoreal

Audio2Photoreal

从音频生成全身逼真的虚拟人物形象。它可以从多人对话中语音中生成与对话相对应的逼真面部表情、完整身体和手势动作。

1130

GitHub/AI开源

Zero123

一种从单个图像到一致的多视图扩散基础模型，旨在使用单视图输入生成 3D 一致的多视图图像。

1310

GitHub/AI开源

Make-A-Character

Make-A-Character

文生3D数字人工具，借助 Make-A-Character，您可以毫不费力地从文本描述中生成可控、逼真、可动画的3D数字人角色。

1090

GitHub/AI开源

QAnything AI

网易有道一个开源的本地知识库问答系统，旨在支持多种文件格式和数据库，允许离线安装和使用。 ,电子邮件(eml),TXT(txt),图像(jpg，jpeg，png),CSV(csv),网页链接(html)

1140

AI大模型 GitHub/AI开源 # 智能写作

Personalized Restoration

Personalized Restoration

一个面部图像精准恢复和个性编辑技术工具，不仅能复原受损图像细节，同时能精准捕捉和重现个人独特的面部特征。同时它还支持换脸。

1080

GitHub/AI开源

PhotoMaker

PhotoMaker：利用多张照片作为身份ID，获取人物特征，然后根据描述生成一个新的、个性化的人物图像。

1200

GitHub/AI开源

Motionshop

AI角色动画工具，通过先进的视频处理和3D渲染技术，MotionShop能够高效地将视频中的某个角色替换为3D人物，同时不改变视频中的其他场景和人物。

1530

GitHub/AI开源 # 模型

LibreChat

一个增强版免费开源的ChatGPT程序，LibreChat 是一个免费开源的聊天机器人平台，集成了多种 AI 模型。

1790

GitHub/AI开源

DiffusionGPT

字节跳动开发的由LLM驱动文本生成图像多合一系统，专门设计用于为不同的输入提示生成高质量的图像。

1350

GitHub/AI开源

Lumiere

谷歌研究院开发的基于空间时间的文本到视频扩散模型。采用了创新的空间时间U-Net架构，能够一次性生成整个视频的时间长度，确保了生成视频的连贯性和逼真度。

1400

GitHub/AI开源

SUPIR

基于大规模扩散的高保真通用图像恢复模型，SupIR能够根据文本提示进行智能修复，提高图像修复的质量和智能程度。

1480

GitHub/AI开源

Diffuse to Choose

Diffuse to Choose

一种基于扩散的图像修复模型，主要用于虚拟试穿场景。它能够在修复图像时保留参考物品的细节，适用于在线购物等虚拟试穿场景中的图像修复任务。

1320

GitHub/AI开源

DuckDB-NSQL

一个专门为DuckDB数据库设计的文本到SQL的模型，你可以使用自然语言说描述你的需求，它会自动转换成SQL代码。

1110

GitHub/AI开源

StreamRAG

一个视频搜索和流媒体代理工具，能让您在 ChatGPT 中与您的视频库聊天并观看视频流。

1370

GitHub/AI开源

WhisperFusion

一个基于WhisperLive把声音转文字和WhisperSpeech理解这些文字的能力构建。能够与AI聊天机器人进行超低延迟对话。

1110

GitHub/AI开源

Open WebUI

一个可扩展、功能丰富且用户友好的自托管 WebUI，适用于各种 LLM 运行器，支持的 LLM 运行器包括 Ollama 和 OpenAI 兼容的 API。

1160

GitHub/AI开源