GitHub/AI开源

共 200 篇网址

ClotheDreamer

一个虚拟试穿项目，可以从文本生成可穿戴3D 服装，ClotheDreamer是上海大学、上海交通大学、复旦大学和腾讯优图实验室出的。最佳服饰零售商

1100

GitHub/AI开源

MimicMotion

腾讯和上交大出的，具有置信度感知姿势指导的高质量人体运动视频生成，MimicMotion可以生成任意长度、具有任何动作指导的高质量视频生成框架。

1460

GitHub/AI开源

FreeAskInternet

FreeAskInternet

FreeAskInternet 是一个完全免费、私有且本地运行的搜索聚合器，并使用 LLM 生成答案，无需 GPU。用户可以提出问题，系统将使用searxng进

1350

GitHub/AI开源

QuickRecorder

一款基于ScreenCapture Kit for macOS的轻量级录屏工具/基于 ScreenCapture Kit的多功能、轻量化、高性能的开源macOS屏幕录制工具。

1670

GitHub/AI开源

LivePortrait

利用AI技术将静态照片转换为视频，展现逼真的面部表情和动作。

1210

GitHub/AI开源

EchoMimic

一个基于音频驱动的肖像动画生成工具，通过可编辑的特征点条件生成逼真、自然的动画，用户可以根据自己的需求调整动画细节。

1250

GitHub/AI开源

Unique3D

一种图像到3D框架，可以从单视图图像高效生成高质量的3D网格。具有最先进的生成保真度和强大的通用性。

1170

GitHub/AI开源

LinkedIn_AIHawk

LinkedIn_AIHawk

您的人工智能求职助手。自动化申请、LinkedIn_AIHawk让你获得个性化建议并更快地找到您梦想的工作。

1080

GitHub/AI开源

TokenFlow

一个利用预训练的文本到图像扩散模型进行视频编辑的框架。它无需进一步训练或微调，即可实现一致的视频编辑效果。

1260

GitHub/AI开源

EZ-Work

一款开源AI文档翻译助手，帮助用户使用 OpenAI 等大型语言模型API快速且经济高效地翻译文档。支持txt、word、csv、excel、pdf、ppt等多种文档格式的翻译，适用于各种需要文档翻译的场景。

1660

GitHub/AI开源

Linly-Dubbing

一款开源的多语言AI配音和视频翻译工具。Linly-Dubbing可以自动将视频翻译成其他语言并生成字幕、克隆视频中说话者的声音并自动配音、进行口型同步。

1430

GitHub/AI开源

ChatTTS-Forge

一个围绕 TTS生成模型开发的项目，ChatTTS-Forge为用户提供灵活的TTS生成能力，支持多种音色、风格控制、长文本推理等功能。

1090

GitHub/AI开源

libcom

上海交通大学牛力教授团队推出的一款图像合成工具箱，经过六年的研发，集成了多种强大的图像处理功能。

1210

GitHub/AI开源

FacePoke

一个实时编辑脸部表情和头部位置的AI 工具。用户可以通过简单的拖放界面，轻松调整面部特征和表情，使静态的肖像变得生动。

1370

GitHub/AI开源

PDFMathTranslate

PDFMathTranslate

一款开源的PDF文档翻译工具，专为翻译科技论文等PDF文件而设计。PDFMathTranslate能够完整保留原文的排版，包括公式和图表，并支持双语对照，保持原有目录结构。

1610

AI-PDF GitHub/AI开源

卡卡字幕助手 | VideoCaptioner

卡卡字幕助手 | VideoCaptioner

一款基于 LLM 的智能字幕助手，无需GPU一键高质量字幕视频合成！支持生成、断句、优化、翻译全流程。卡卡字幕助手让视频字幕制作简单高效！优化、翻译，字幕视频全流程一键处理！

1560

GitHub/AI开源字幕 # 字幕

MinerU

一站式开源高质量数据提取工具，支持PDF、网页、多格式电子书提取，自动识别并转换LaTeX格式、HTML格式，自动OCR，支持多语言。

1580

AI-PDF GitHub/AI开源

VISION XL

一款专注于视频质量修复与增强的全新工具，VISION XL利用潜在扩散模型来解决高清视频的逆问题，能够在资源要求较低的环境下提供出色的修复与超分辨率能力。

1240

GitHub/AI开源

LogoCreator

一款由开源达人Hassan打造的AI Logo设计工具，LogoCreator依托Together AI平台的Flux模型实现，为用户提供智能、高效的Logo生成功能。

1090

GitHub/AI开源

CodeName Goose

一款开源代码智能体Agent，Codename Goose不仅能自动生成代码，还能安装、执行、测试。

1420

GitHub/AI开源智能体

Cherry Studio官网

Cherry Studio官网

一款开源的支持多种大型语言模型（LLM）桌面AI客户端，集成了多个LLM，支持Ollama本地模型部署。

1920

AI大模型 GitHub/AI开源 # GPT # LLM # 人工智能

Tarsier

字节跳动推出的一系列大规模视觉语言模型（LVLM），专注于视频理解任务，包括视频描述、问答、视频定位、幻觉测试等功能。

1130

GitHub/AI开源

FUZZ

由Riffusion推出的一款基于扩散模型（Diffusion Model）的全新音乐生成模型，该工具能够通过“想象”生成音频的声谱图（Spectrogram），然后将其转换为音频。便携式音箱

1330

GitHub/AI开源

Midscene.js

一款基于AI的自动化浏览器助手，能够通过自然语言操作网页。你只需描述要执行的任务，Midscene.js会自动处理网页，如发推文、验证内容、搜索信息等功能。

1650

GitHub/AI开源工作流/RPA

JoyGen

京东科技与香港大学合作开发的音频驱动3D说话人脸视频生成框架，提供精确的唇部与音频同步，以精确模拟说话者的唇部动作和面部表情，让生成的视频更逼真。

1360

GitHub/AI开源

Hibiki

Kyutai Labs开发的高保真实时语音翻译模型，可以保留原声特点并进行实时翻译，边听边翻译，像同声传译一样实时输出，同时生成语音和文字翻译。

1100

GitHub/AI开源

AstrBot

一个开源的多平台 LLM 聊天机器人及开发框架，支持多个消息平台的集成，如QQ、微信，AstrBot支持多种大型语言模型（LLM）的接入。

1490

GitHub/AI开源工作流/RPA

DeepClaude

一个将DeepSeek R1模型推理能力和Claude的代码生成能力的开源工具，提供统一的API和聊天界面，还可自定义配置、具有低延迟等特点。

1110

GitHub/AI开源

Enhance-A-Video

Enhance-A-Video

新加坡国立大学、上海人工智能实验室和德克萨斯大学奥斯汀分校联合开发的视频生成增强算法。

1200

GitHub/AI开源

LangBot

一个开源大模型原生即时通信机器人平台，支持多平台（如微信、飞书等）和多种大语言模型（如 ChatGPT、DeepSeek等)，具备多模态交互能力。

1400

GitHub/AI开源

Video-Subtitle-Master

Video-Subtitle-Master

一个用于批量为视频生成字幕的客户端开源工具，并支持将字幕翻译成其他语言。

1290

GitHub/AI开源字幕 # 字幕

LiberSonora

一个基于AI的、开源有声书工具集，LiberSonora提供智能字幕提取、AI标题生成、多语言翻译等功能，并且支持 GPU 加速、批量离线处理。

1100

GitHub/AI开源

Simba

一个能够帮助用户轻松收纳各种文档的强大工具，Simba可以作为一个后端知识库与任何检索增强生成（RAG）系统进行无缝集成。

1200

GitHub/AI开源

MakeAnything

一个基于扩散变换器的序列生成模型，通过其强大的生成能力，生成一致性的序列图像。

1370

GitHub/AI开源文/图生图

GitHub · Change is constant. GitHub keeps you ahead. · GitHub

GitHub · Change is constant. GitHub keeps you ahead. · GitHub

Join the world's most widely adopted, AI-powered developer platform where millions of developers, businesses, and the largest open source community build software that advances humanity.

1590

AI大模型 GitHub/AI开源

Step-Video-T2V

一个由阶跃星辰与吉利汽车合作开源的先进文本到视频生成模型。支持中文与英文提示输入，应用于在如广告、影视制作、自动化内容创作等场景。

1270

GitHub/AI开源图/文生视频

WeChat Bot

基于WeChaty结合OpenAI ChatGPT、Kimi、讯飞等多种AI服务实现的开源微信机器人项目，用于自动回复微信消息或管理微信群/好友。

1700

GitHub/AI开源自媒体

NeuraPress/Markdown编辑器

NeuraPress/Markdown编辑器

一款专注于微信公众号排版的Markdown编辑器，支持移动端，搭配DeepSeek和微信公众号助手，利用碎片化时间，通过手机就能编辑并发布带有排版效果的公众号文章。

1380

GitHub/AI开源排版/分发

HiveChat

一个专为中小型团队设计的开源AI聊天机器人项目，支持Deepseek、OpenAI、Claude和Gemini等多种主流AI模型。

1260

AI大模型 GitHub/AI开源

Anda

一个以Rust为基础构建的AI智能体框架，整合了ICP区块链并且支持TEE环境，Anda的目标在于构建一个能够高度组合、自主运行且拥有持续记忆能力的AI智能体网络。

1190

GitHub/AI开源智能体

Memento

一款基于mpv构建的开源视频播放器，专为学习日语设计。它巧妙地将视频播放与语言学习功能结合，支持通过影视内容进行语法分析、生词捕捉和记忆卡片制作。

1240

GitHub/AI开源自媒体

Arxiv-Markdown-Parser-Plugin

Arxiv-Markdown-Parser-Plugin

一款能够一键将arXiv上的论文转换为Markdown格式的浏览器插件，无论该论文呈现的是摘要、PDF版本还是HTML版本。

1250

AI论文 GitHub/AI开源

SurveyX

一个利用大型语言模型（LLMs）生成高质量、特定领域学术论文和调查的先进学术调查自动化系统。

1200

AI大模型 GitHub/AI开源

MiniMates

一款高性能的轻量级数字人驱动算法，具备语音和表情两种驱动模式，MiniMates能够在普通电脑上实现实时运行，用户能够定制自己的AI伙伴。

1460

AI数字人 GitHub/AI开源

Awesome-Ollama-Server

Awesome-Ollama-Server

一个用于实时监控和检测 Ollama 服务可用性和性能的系统。支持多语言，能够方便用户进行服务检测和性能监控。

1010

GitHub/AI开源

Magic Resume

一个现代化的在线简历编辑器，它基于 Next.js 和 Framer Motion 构建，可以让用户能够轻松创建专业的简历。

1160

AI简历 GitHub/AI开源

PPTist

PPTist是一款基于Vue3、Canvas及TypeScript构建的开源在线演示文稿（PPT）编辑器，旨在提供与桌面端一致的流畅办公体验。

3.7K0

GitHub/AI开源

MetaGPT

The Multi-Agent Framework

1600

AI大模型 GitHub/AI开源

SwiftChat

一款基于React Native开发的快速、安全、跨平台聊天应用，支持实时流式聊天功能和Markdown语法，还可以生成AI图像，兼容DeepSeek、Amazon Bedrock、Ollama和OpenAI等模型。

1440

GitHub/AI开源

Maple Mono

一款专注于优化编码体验的开源等宽字体，它提供无限的字体粗细和手工微调的斜体字形，圆角设计使其看起来丝滑舒适，特别适合长时间编码工作。

1300

AI编程 GitHub/AI开源

Coze on WeChat

一个基于微信平台开发的智能助手，主要对接 Coze 平台，支持大部分 Coze Bot 功能。它允许用户通过微信与 AI 聊天机器人进行交互，支持文本、语音等多种交互方式。

1440

GitHub/AI开源智能体

AutoGen

微软开发的一个开源框架，用于构建和管理基于LLM的多代理系统。它允许用户创建多个Agent，这些代理可以通过对话协作完成复杂的任务。

1450

GitHub/AI开源工作流/RPA

Rasa

一个开源的AI机器学习框架，专注于构建自然语言对话系统，如聊天机器人和语音助手，Rasa广泛应用于客户服务、智能助手、企业自动化等多个领域。

1900

AI大模型 GitHub/AI开源

Atomic Agents

一个适用于构建模块化、可扩展的AI代理开源框架，它将复杂的AI系统分解为最小的、不可分割的组件，并通过这些组件的灵活组合来构建强大的 AI 应用。

1390

GitHub/AI开源智能体

AgentUniverse

一个面向复杂业务场景设计的多智能体协作框架，它提供了快速易用的大模型智能体应用搭建能力，以及丰富的多智能体协同模式组件。

1320

GitHub/AI开源智能体

Motia

一个专为开发者设计的AI代理框架，帮助开发者快速搭建、测试和部署生产级的 AI 代理。它强调代码优先和事件驱动，支持多语言开发，并提供可视化界面，使开发者能够专注于业务逻辑。

1570

AI编程 GitHub/AI开源

Colors

一个开源的学术期刊配色推荐器，收集整理了众多高质量论文插图的配色，可帮助我们轻松快速找到专业水准的配色组合。

1590

GitHub/AI开源调色配色

BotSharp

一个基于.NET开发的开源AI多智能体应用开发框架，它可以快速将大型语言模型（LLMs）快速集成到现有业务系统中。

1360

AI大模型 GitHub/AI开源

Pydantic AI

一个Pydantic 团队开发的Python代理框架，可以通过生成式AI轻松构建生产级应用程序。

1120

AI编程 GitHub/AI开源

Automa

一款开源的低代码/无代码浏览器自动化工具，用户可以通过可视化界面，像搭积木一样将各种功能模块连接起来，构建自定义的自动化流程。

2300

GitHub/AI开源工作流/RPA

OCRmyPDF

一款开源的命令行工具，用于给扫描的 PDF 文件添加可搜索的OCR文本层。它支持多语言，能优化图像、纠偏、清洁页面，并自动旋转方向，生成 PDF/A 格式文件。

1330

AI-PDF GitHub/AI开源

MagicColor

香港科技大学团开发的首个支持单次前向传播多实例集成的线稿上色框架，用户仅需上传一张黑白线稿和若干参考图像，系统便能在数秒内自动完成精准且自然的色彩填充。

1430

GitHub/AI开源文/图生图

Droidrun

一款可以通过AI代理实现Android设备的自动化操作开源框架，它结合视觉解析与UI结构提取技术，支持多种语言模型，可自动执行任务、处理复杂界面和动态UI。最佳智能手机

1480

GitHub/AI开源工作流/RPA

PiliPala

一款基于Flutter开发的B站开源第三方客户端。支持Android和iOS平台，提供无广告的高清视频播放体验，具备倍速播放、离线缓存、稍后再看等功能。

1320

GitHub/AI开源自媒体

Hyprnote

一个开源的会议笔记AI工具，适合经常参加会议的人使用。Hyprnote能实时把会议内容录下来并转成文字，还能整理出会议要点。

1310

AI会议纪要 GitHub/AI开源

Flowise

一款开源的低/无代码工具，只要用于可视化构建LLM工作流。它通过拖拽界面，让用户不需要编写的复杂代码就可以快速搭建 LLM 应用。

1450

GitHub/AI开源工作流/RPA

AI看线（AI-Kline）

一个结合K线图，技术指标，财务数据，新闻数据的AI股票分析及预测框架，利用AI对股票市场进行深入分析。

1740

AI分析总结 GitHub/AI开源

n8n

开源AI与工作流自动化平台，通过可视节点与自定义代码连接应用服务实现智能自动化。

1790

AI大模型 GitHub/AI开源 # 开发工具

ResumeToJob

一个免费开源的在线简历生成器，用户可以实时编辑简历并一键导出 PDF 文件，数据会保存在本地浏览器，并有多种好看的简历模板，手机和电脑都能用。

1710

AI简历 GitHub/AI开源 # open-source

Dual AI Chat

一个聊天应用，核心设计是让两个不同风格的人工智能通过辩论协作生成回答。默认接入 Google Gemini API，同时兼容其他 OpenAI 标准的 API 接口，也支持本地模型或其他托管服务。

1380

AI大模型 GitHub/AI开源

SmythOS

一个开源的AI操作系统，支持用户在90秒内通过聊天提示快速创建AI代理。它提供可视化工作流、API调用、分类器等功能。

1420

GitHub/AI开源工作流/RPA

NativeMind

一款开源的本地化AI助手浏览器插件，支持Ollama和WebLLM两种本地模型，全部数据处理都在本地完成，有效保护用户隐私。

1550

GitHub/AI开源谷歌插件

ExplorerTabUtility

ExplorerTabUtility

一款 Windows 11 资源管理器多标签扩展工具，它能把新窗口都改成标签页，还带快捷键操作，文件资源管理器用起来就像浏览器一样方便，标签页也能搜、能批量管。

1350

GitHub/AI开源自媒体

SuperClaude

SuperClaude 是一个为 Claude Code 量身打造的零门槛编程的上下文工程开源框架。它通过一系列专门设计的命令、认知角色和开发方法，可以大大增强Claude Code 的能力。

1290

AI编程 GitHub/AI开源

LiYing

一款证件照AI自动化处理神器，用于自动化处理证件照的程序，可在本地完全离线运行，适用于照相馆等场景，可以大大提升工作效率。

1720

AI证件照 GitHub/AI开源

中国大模型列表大全

中国大模型列表大全，全面收集有明确来源的大模型情况，包括机构、来源信息和分类等，随时更新。旨在记录中国大模型发展情况，欢迎在Issues中提供提供线索和素材。

1570

GitHub/AI开源

AingDesk

一款简单好用的AI助手，可以简化AI模型的本地部署和管理，支持多种AI模型的一键部署、联网搜索、模型共享等功能。

1330

GitHub/AI开源

CodeGPT

CodeGPT 是一个开源扩展，可将人工智能引入您的 IDE（集成开发环境）,通过使用自然语言查询生成代码片段、注释、文档、测试等。

1430

AI编程 GitHub/AI开源

UIGEN-T1

一个基于 Qwen2.5-Coder-7B 模型微调的开源 UI 设计生成工具，能够根据用户输入的提示生成结构清晰且符合标准的 HTML 和 CSS 代码

1180

AI编程 GitHub/AI开源

IndexTTS

B站基于XTTS和Tortoise开发的文本转语音模型，具备工业级零样本TTS能力。针对中文场景创新采用字符-拼音混合建模，可快速修正发音错误。

1720

GitHub/AI开源文字&语音

Eigent AI

全球首个桌面端多智能体生产力平台，采用多智能体协作架构，通过拆分任务、并行处理来提高复杂任务的执行效率，支持本地部署和云端运行，还有人类参与机制，能保证结果准确可靠。

1520

AI编程 GitHub/AI开源

Presenton

一个可以本地运行的开源AI PPT生成器，使用OpenAI、Gemini或Ollama等模型，确保数据隐私和控制。

1530

AI-PPT GitHub/AI开源

Maxun.dev

一个无代码网页数据提取平台，可以可靠、大规模地从网站提取和自动化数据，能将任何网站转为实时数据馈送，Maxun.dev使用简便，不用编码，几分钟就可以上手。

1330

GitHub/AI开源工作流/RPA

BrowserOS

一款基于 Chromium 内核带 AI 代理功能的浏览器，能自动完成在线购物、信息收集等多种网页操作。它支持本地 Ollama 模型，保护用户隐私。

1200

GitHub/AI开源工作流/RPA

StableAvatar

复旦大学、微软亚洲研究院和西安交通大学等机构的研究人员开发的一个能通过音频直接生成唱歌或说话视频的工具，而且视频时长不受限制，画面质量也很高。

1180

GitHub/AI开源图/文生视频

Archon

一个能让AI 自动生成和优化其他AI代理的开源工具。作为首款 “Agenteer”，Archon 第六版支持多种工具库和 MCP 服务器集成，让生成的AI更高效可靠。

1240

AI编程 GitHub/AI开源

Klic Studio

Krillin AI推出的视频翻译和配音工具，它支持100多种语言的翻译和配音，有AI同步口型、自然声音克隆功能，还能把音频/视频转成文字。

1680

AI翻译 GitHub/AI开源

ToonComposer

腾讯推出的AI自动上色和生成动画工具，它能将动画制作里“补帧”和“上色”这两个步骤合并成“生成后原画”阶段，让动画制作流程变得更简单。

1420

GitHub/AI开源

React-Tetris

一个用 React 框架开发的经典俄罗斯方块游戏。它用了组件化设计，能键盘控制，也能适配不同屏幕，既可以嵌入 React 应用，也能当独立组件用。

1170

GitHub/AI开源

Workout.cool

一个免费开源的健身指导平台，拥有全面的锻炼数据库，主要用来帮用户制定训练计划、记录锻炼进度，还能查大量训练动作和获取详细的锻炼指导和视频演示。

1280

GitHub/AI开源

Aice PS

网页版AI照片编辑器，利用Google aistudio的的先进能力，支持 AI 生成图片、智能修图、创意滤镜等功能，适用于创意设计、照片编辑等场景。

1600

GitHub/AI开源

ReactBits

一个免费开源的动画化、可交互React组件库，里面有好多动画化、能交互而且可以随便改的 React 组件，能用来做出特别好看的用户界面。

1870

GitHub/AI开源

Awesome-Nano-Banana

Awesome-Nano-Banana

JimmyLv创建的GitHub仓库，专门收集和展示Google的Nano Banana模型生成的图片和提示词。

1160

GitHub/AI开源

ChopperBot

一款能用于像虎牙、斗鱼、抖音、BiliBili、TikTok、Twitch 等平台的智能直播视频剪辑发布工具，能实现自动化视频剪辑和自动化切片操作，而且非常智能。

1670

GitHub/AI开源工作流/RPA

FlyCut Caption

一款开源的视频字幕编辑工具，支持智能生成字幕、编辑字幕和裁剪视频。它通过语音识别生成字幕，你可以直接编辑字幕来剪辑视频。

1560

GitHub/AI开源字幕 # 字幕

ValueCell AI

全球首个开源金融智能体平台，采用社区驱动和多智能体模式，ValueCell提供选股、分析、新闻推送、市场研究、数据收集、情绪分析、策略生成等功能。

1540

GitHub/AI开源

BongoCat

一款轻量级、开源且跨平台的桌面猫咪宠物应用，由开发者ayoungweb 制作，它通过可爱的猫咪形象与用户互动，能根据键盘敲击和鼠标操作做出反应。交互式宠物

5090

GitHub/AI开源

LandPPT

一个基于大语言模型的开源免费AIPPT生成平台，支持将文档内容自动转为专业PPT，具备多AI模型支持、智能文档处理、智能配图、深度研究等功能。

1540

AI-PPT GitHub/AI开源 # AI PPT # LLM

Windrecorder

捕风记录仪，一款开源的屏幕录制与检索工具，它记录屏幕内容来实现记忆搜索，帮用户检索记忆线索，支持按OCR文本或画面描述查询，还提供活动统计等功能。

1180

GitHub/AI开源

长亭百智云

The most open-minded community to make you a product manager too

1510

AI编程 GitHub/AI开源