GitHub/AI开源

共 200 篇网址

PPTist

PPTist是一款基于Vue3、Canvas及TypeScript构建的开源在线演示文稿（PPT）编辑器，旨在提供与桌面端一致的流畅办公体验。

6.1K4

GitHub/AI开源

BongoCat

一款轻量级、开源且跨平台的桌面猫咪宠物应用，由开发者ayoungweb 制作，它通过可爱的猫咪形象与用户互动，能根据键盘敲击和鼠标操作做出反应。交互式宠物

7270

GitHub/AI开源

Cherry Studio官网

Cherry Studio官网

一款开源的支持多种大型语言模型（LLM）桌面AI客户端，集成了多个LLM，支持Ollama本地模型部署。

7040

AI大模型 GitHub/AI开源 # GPT # LLM # 人工智能

CodeFormer

CodeFormer开源盲人脸修复框架，支持老照片修复、人脸增强、颜色化、局部修复与视频增强。

6250

GitHub/AI开源

AutoClip

一款AI智能视频切片工具，能自动下载B站视频、剪辑精彩片段并生成合集，适合播客、直播、讲解等内容的切片。

5050

GitHub/AI开源

AstrBot

一个开源的多平台 LLM 聊天机器人及开发框架，支持多个消息平台的集成，如QQ、微信，AstrBot支持多种大型语言模型（LLM）的接入。

4700

GitHub/AI开源工作流

MinerU

一站式开源高质量数据提取工具，支持PDF、网页、多格式电子书提取，自动识别并转换LaTeX格式、HTML格式，自动OCR，支持多语言。

4410

AI-PDF GitHub/AI开源

n8n

开源AI与工作流自动化平台，通过可视节点与自定义代码连接应用服务实现智能自动化。

3580

AI大模型 GitHub/AI开源 # 开发工具

Automa

一款开源的低代码/无代码浏览器自动化工具，用户可以通过可视化界面，像搭积木一样将各种功能模块连接起来，构建自定义的自动化流程。

3500

GitHub/AI开源工作流

ReactBits

一个免费开源的动画化、可交互React组件库，里面有好多动画化、能交互而且可以随便改的 React 组件，能用来做出特别好看的用户界面。

3250

GitHub/AI开源

LandPPT

一个基于大语言模型的开源免费AIPPT生成平台，支持将文档内容自动转为专业PPT，具备多AI模型支持、智能文档处理、智能配图、深度研究等功能。

3250

AI-PPT GitHub/AI开源 # AI PPT # LLM

DeepFaceLab

DeepFaceLab 是一种利用深度学习识别来交换图片和视频中的人脸的工具。

3170

GitHub/AI开源

VideoFusion

一款开源、免费的批量化视频处理工具，自动去黑边,视频合并,AI降噪,视频压缩,无需繁杂操作，轻轻点击,应有尽有。

3110

GitHub/AI开源

Jan.ai

ChatGPT 的开源、托管替代品，jan.ai可在您的计算机上100%离线运行。

3080

GitHub/AI开源 # LLM

XHS-Downloader

小红书链接提取/作品采集工具：提取账号发布、收藏、点赞作品链接；提取搜索结果作品链接、用户链接；采集小红书作品信息；提取小红书作品下载地址；下载小红书无水印作品文件！

3070

GitHub/AI开源

Platon.AI – 柏拉图智能

Platon.AI – 柏拉图智能

Platon.AI柏拉图智能不仅仅是 AI 爬虫，也是 AI agents 的基础设施。 AI agents 要使用工具，就必须高速阅读理解在线网页，理解网页上的每一个元素——这就是 platon.AI 的技术。

2930

GitHub/AI开源

Zread

专为开发者设计的AI源码解读产品

2910

GitHub/AI开源 # AI # LLM

ResumeToJob

一个免费开源的在线简历生成器，用户可以实时编辑简历并一键导出 PDF 文件，数据会保存在本地浏览器，并有多种好看的简历模板，手机和电脑都能用。

2860

AI简历 GitHub/AI开源 # open-source

IndexTTS

B站基于XTTS和Tortoise开发的文本转语音模型，具备工业级零样本TTS能力。针对中文场景创新采用字符-拼音混合建模，可快速修正发音错误。

2840

GitHub/AI开源文字&语音

VideoSrt

VideoSrt是一个可以识别视频语音自动生成字幕 SRT文件的开源软件工具。适用于快速、批量的为媒体（视频/音频）生成中/英文字幕、文本文件的业务场景。

2810

GitHub/AI开源

GenAI_Agents

一个专注于生成式AI Agents技术的开源项目，GenAI_Agents提供从基础到高级的教程与实现代码，帮助开发者学习并构建智能、交互式的AI系统。

2800

GitHub/AI开源

卡卡字幕助手 | VideoCaptioner

卡卡字幕助手 | VideoCaptioner

一款基于 LLM 的智能字幕助手，无需GPU一键高质量字幕视频合成！支持生成、断句、优化、翻译全流程。卡卡字幕助手让视频字幕制作简单高效！优化、翻译，字幕视频全流程一键处理！

2780

GitHub/AI开源字幕 # 字幕

Midscene.js

一款基于AI的自动化浏览器助手，能够通过自然语言操作网页。你只需描述要执行的任务，Midscene.js会自动处理网页，如发推文、验证内容、搜索信息等功能。

2770

GitHub/AI开源工作流

Rasa

一个开源的AI机器学习框架，专注于构建自然语言对话系统，如聊天机器人和语音助手，Rasa广泛应用于客户服务、智能助手、企业自动化等多个领域。

2770

AI大模型 GitHub/AI开源

Klic Studio

Krillin AI推出的视频翻译和配音工具，它支持100多种语言的翻译和配音，有AI同步口型、自然声音克隆功能，还能把音频/视频转成文字。

2770

AI翻译 GitHub/AI开源

Presenton

一个可以本地运行的开源AI PPT生成器，使用OpenAI、Gemini或Ollama等模型，确保数据隐私和控制。

2760

AI-PPT GitHub/AI开源

ChopperBot

一款能用于像虎牙、斗鱼、抖音、BiliBili、TikTok、Twitch 等平台的智能直播视频剪辑发布工具，能实现自动化视频剪辑和自动化切片操作，而且非常智能。

2760

GitHub/AI开源工作流

ValueCell AI

全球首个开源金融智能体平台，采用社区驱动和多智能体模式，ValueCell提供选股、分析、新闻推送、市场研究、数据收集、情绪分析、策略生成等功能。

2760

GitHub/AI开源

EZ-Work

一款开源AI文档翻译助手，帮助用户使用 OpenAI 等大型语言模型API快速且经济高效地翻译文档。支持txt、word、csv、excel、pdf、ppt等多种文档格式的翻译，适用于各种需要文档翻译的场景。

2750

GitHub/AI开源

WeChat Bot

基于WeChaty结合OpenAI ChatGPT、Kimi、讯飞等多种AI服务实现的开源微信机器人项目，用于自动回复微信消息或管理微信群/好友。

2750

GitHub/AI开源自媒体

AutoGen

微软开发的一个开源框架，用于构建和管理基于LLM的多代理系统。它允许用户创建多个Agent，这些代理可以通过对话协作完成复杂的任务。

2670

GitHub/AI开源工作流

AI看线（AI-Kline）

一个结合K线图，技术指标，财务数据，新闻数据的AI股票分析及预测框架，利用AI对股票市场进行深入分析。

2640

AI分析总结 GitHub/AI开源

DeepSeek官方工具箱

由 DeepSeek官方团队维护的开源项目，提供与 DeepSeek API 集成的各种工具和资源，应用程序、AI Agent 框架、RAG 框架、浏览器插件、VS Code 插件等。

2630

GitHub/AI开源

RTranslator

一款开源、免费、离线的 Android 实时翻译应用程序。连接到拥有该应用程序的人，连接蓝牙耳机，将手机放入口袋中，然后您就可以像对方说您的语言一样进行对话。最佳智能手机

2630

GitHub/AI开源

QuickRecorder

一款基于ScreenCapture Kit for macOS的轻量级录屏工具/基于 ScreenCapture Kit的多功能、轻量化、高性能的开源macOS屏幕录制工具。

2630

GitHub/AI开源

PDFMathTranslate

PDFMathTranslate

一款开源的PDF文档翻译工具，专为翻译科技论文等PDF文件而设计。PDFMathTranslate能够完整保留原文的排版，包括公式和图表，并支持双语对照，保持原有目录结构。

2630

AI-PDF GitHub/AI开源

LiYing

一款证件照AI自动化处理神器，用于自动化处理证件照的程序，可在本地完全离线运行，适用于照相馆等场景，可以大大提升工作效率。

2620

AI证件照 GitHub/AI开源

Colors

一个开源的学术期刊配色推荐器，收集整理了众多高质量论文插图的配色，可帮助我们轻松快速找到专业水准的配色组合。

2610

GitHub/AI开源调色配色

YouDub-Webui

一款开源的多语言AI配音和视频翻译工具，优质视频中文化工具，YouDub-webui提供了一套完整的视频中文化工具包，涵盖了从视频下载、语音识别、字幕翻译、AI声音克隆、视频处理、自动上传等一系列流程。

2600

GitHub/AI开源

PDF补丁丁|PDFPatcher

PDF补丁丁|PDFPatcher

PDFPatcher，是国内开发者wmjordan用.NET框架开发的PDF工具，能帮咱们处理日常办公、学习和整理文档时遇到的PDF问题。

2580

AI-PDF GitHub/AI开源

DeepFaceLive

DeepFaceLive是一款基于人工智能的面部合成技术，它可以将一个人的面部表情和动作合成到另一个人的脸上，从而实现非常逼真的面部合成效果。

2580

GitHub/AI开源

Flowise

一款开源的低/无代码工具，只要用于可视化构建LLM工作流。它通过拖拽界面，让用户不需要编写的复杂代码就可以快速搭建 LLM 应用。

2570

GitHub/AI开源工作流

Motionshop

AI角色动画工具，通过先进的视频处理和3D渲染技术，MotionShop能够高效地将视频中的某个角色替换为3D人物，同时不改变视频中的其他场景和人物。

2560

GitHub/AI开源 # 模型

DUIX

硅基智能打造的AI数字人智能交互平台。通过将数字人交互能力开源，开发者可自行接入多方大模型、语音识别（ASR）、语音合成（TTS）能力，实现数字人实时交互。

2540

GitHub/AI开源

GitHub · Change is constant. GitHub keeps you ahead. · GitHub

GitHub · Change is constant. GitHub keeps you ahead. · GitHub

Join the world's most widely adopted, AI-powered developer platform where millions of developers, businesses, and the largest open source community build software that advances humanity.

2540

AI大模型 GitHub/AI开源

Stirling-PDF

一个基于Web强大的开源PDF操作工具。它使您能够对 PDF 文件执行各种操作，包括拆分、合并、转换、重组、添加图像、旋转、压缩等。

2530

AI-PDF GitHub/AI开源

Droidrun

一款可以通过AI代理实现Android设备的自动化操作开源框架，它结合视觉解析与UI结构提取技术，支持多种语言模型，可自动执行任务、处理复杂界面和动态UI。最佳智能手机

2530

GitHub/AI开源工作流

Caesium

一款免费的开源在线图像压缩工具，Caesium支持JPG、PNG等格式的批量处理和预览功能。能将照片压缩至原始大小的90%。

2520

GitHub/AI开源

LibreChat

一个增强版免费开源的ChatGPT程序，LibreChat 是一个免费开源的聊天机器人平台，集成了多种 AI 模型。

2480

GitHub/AI开源

MetaGPT

The Multi-Agent Framework

2480

AI大模型 GitHub/AI开源

小半WordPress Ai助手

小半WordPress Ai助手

一个全免费开源WordPress插件，支持AI对话聊天、文章生成、文章总结、文章翻译、生成PPT等功能，此外它还能对接DeepSeek、豆包和通义千问等模型。

2480

GitHub/AI开源

AI Comic Factory

AI Comic Factory

AI Comic Factory是一个免费开源的AI漫画生成器，使用LLM + SDXL开发。它能够根据用户提供的提示词生成漫画，并支持无损放大、保存和打印。

2470

GitHub/AI开源

ProPainter

ProPainter，一键移除视频内的移动物体，一键移除视频水印。

2460

GitHub/AI开源

PDF-Guru

一个通用型PDF文件处理工具，PDF-Guru包含PDF合并、拆分、旋转、水印、加密、转换等20多项常用功能，完全开源，个人免费使用，界面简洁，简单易用。

2440

GitHub/AI开源

Coze on WeChat

一个基于微信平台开发的智能助手，主要对接 Coze 平台，支持大部分 Coze Bot 功能。它允许用户通过微信与 AI 聊天机器人进行交互，支持文本、语音等多种交互方式。

2440

GitHub/AI开源智能体

Diffutoon

一项突破性的卡通着色进步，植根于扩散模型，通过解决四个子问题：风格化、一致性增强、结构指导和着色，将逼真的视频转变为动漫风格。

2430

GitHub/AI开源

Aice PS

网页版AI照片编辑器，利用Google aistudio的的先进能力，支持 AI 生成图片、智能修图、创意滤镜等功能，适用于创意设计、照片编辑等场景。

2430

GitHub/AI开源

DDColor图像上色

一个为黑白图像上色的魔搭模型，通过双解码器实现逼真的图像着色，输入一张黑白图像，实现端到端的全图上色，返回上色处理后的彩色图像。

2410

GitHub/AI开源调色配色 # 模型

Omnivore

一款免费、开源、适合认真阅读的稍后阅读应用程序。不受干扰。注重隐私。开源。专为知识工作者和终身学习者而设计。

2400

GitHub/AI开源

FlyCut Caption

一款开源的视频字幕编辑工具，支持智能生成字幕、编辑字幕和裁剪视频。它通过语音识别生成字幕，你可以直接编辑字幕来剪辑视频。

2400

GitHub/AI开源字幕 # 字幕

Deepfakes Creator

Deepfakes Creator

Deepfakes Creator，可以通过文本输入生成逼真的会说话的真人视频。用户只需要上传想要化身模仿的人的照片，并写一个剧本，工具就能创建出逼真的人物化身视频，模拟人物说话。

2380

GitHub/AI开源

SmythOS

一个开源的AI操作系统，支持用户在90秒内通过聊天提示快速创建AI代理。它提供可视化工作流、API调用、分类器等功能。

2380

GitHub/AI开源工作流

LangBot

一个开源大模型原生即时通信机器人平台，支持多平台（如微信、飞书等）和多种大语言模型（如 ChatGPT、DeepSeek等)，具备多模态交互能力。

2370

GitHub/AI开源

ToonComposer

腾讯推出的AI自动上色和生成动画工具，它能将动画制作里“补帧”和“上色”这两个步骤合并成“生成后原画”阶段，让动画制作流程变得更简单。

2360

GitHub/AI开源

SUPIR

基于大规模扩散的高保真通用图像恢复模型，SupIR能够根据文本提示进行智能修复，提高图像修复的质量和智能程度。

2350

GitHub/AI开源

Linly-Dubbing

一款开源的多语言AI配音和视频翻译工具。Linly-Dubbing可以自动将视频翻译成其他语言并生成字幕、克隆视频中说话者的声音并自动配音、进行口型同步。

2350

GitHub/AI开源

Wiseflow

一款敏捷的信息挖掘开源免费工具，Wiseflow可以从网站、微信公众号、社交平台等各种信息源中按设定的关注点提炼讯息，自动做标签归类并上传数据库。

2330

GitHub/AI开源

MiniMates

一款高性能的轻量级数字人驱动算法，具备语音和表情两种驱动模式，MiniMates能够在普通电脑上实现实时运行，用户能够定制自己的AI伙伴。

2330

AI数字人 GitHub/AI开源

NativeMind

一款开源的本地化AI助手浏览器插件，支持Ollama和WebLLM两种本地模型，全部数据处理都在本地完成，有效保护用户隐私。

2330

GitHub/AI开源谷歌插件

FacePoke

一个实时编辑脸部表情和头部位置的AI 工具。用户可以通过简单的拖放界面，轻松调整面部特征和表情，使静态的肖像变得生动。

2320

GitHub/AI开源

MagicColor

香港科技大学团开发的首个支持单次前向传播多实例集成的线稿上色框架，用户仅需上传一张黑白线稿和若干参考图像，系统便能在数秒内自动完成精准且自然的色彩填充。

2320

GitHub/AI开源文/图生图

Ncurator/馆长

知识库AI问答助手，让AI帮助你整理与分析知识，馆长基于语义和关键词搜索技术，当你输入问题时，馆长智能分析你的查询，并从你的知识库中检索出最相关的信息。

2310

GitHub/AI开源 # AI # GPT

SwiftChat

一款基于React Native开发的快速、安全、跨平台聊天应用，支持实时流式聊天功能和Markdown语法，还可以生成AI图像，兼容DeepSeek、Amazon Bedrock、Ollama和OpenAI等模型。

2310

GitHub/AI开源

CodeName Goose

一款开源代码智能体Agent，Codename Goose不仅能自动生成代码，还能安装、执行、测试。

2290

GitHub/AI开源智能体

NeuraPress/Markdown编辑器

NeuraPress/Markdown编辑器

一款专注于微信公众号排版的Markdown编辑器，支持移动端，搭配DeepSeek和微信公众号助手，利用碎片化时间，通过手机就能编辑并发布带有排版效果的公众号文章。

2280

GitHub/AI开源排版/分发

长亭百智云

The most open-minded community to make you a product manager too

2270

GitHub/AI开源工作流

Quick Prompt

一个专注于提示词（Prompt）的管理和快速输入的浏览器扩展插件。可以帮助用户创建、管理和组织自己的提示词库，并在任何网页输入框中快速插入预设的提示词内容。

2260

GitHub/AI开源谷歌插件

APISR

一个专注于动漫图像超分辨率的项目，旨在恢复和增强来自现实世界场景的低质量、低分辨率动漫图像和视频源。

2260

GitHub/AI开源

Whisper语音识别模型

Whisper 是一种通用的语音识别模型。它在不同音频的大型数据集上进行训练，也是一个多任务模型，可以执行多语言语音识别以及语音翻译和语言识别。

2260

AI大模型 GitHub/AI开源

易魔声EmotiVoice

易魔声EmotiVoice是一个强大的开源TTS引擎，支持中英文双语，包含2000多种不同的音色，以及特色的情感合成功能，支持合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音。

2260

GitHub/AI开源

StreamRAG

一个视频搜索和流媒体代理工具，能让您在 ChatGPT 中与您的视频库聊天并观看视频流。

2260

GitHub/AI开源

AutoStudio

在多轮交互式图像生成中制作一致的主题

2260

GitHub/AI开源

JoyGen

京东科技与香港大学合作开发的音频驱动3D说话人脸视频生成框架，提供精确的唇部与音频同步，以精确模拟说话者的唇部动作和面部表情，让生成的视频更逼真。

2260

GitHub/AI开源

Lumiere

谷歌研究院开发的基于空间时间的文本到视频扩散模型。采用了创新的空间时间U-Net架构，能够一次性生成整个视频的时间长度，确保了生成视频的连贯性和逼真度。

2250

GitHub/AI开源

OCRmyPDF

一款开源的命令行工具，用于给扫描的 PDF 文件添加可搜索的OCR文本层。它支持多语言，能优化图像、纠偏、清洁页面，并自动旋转方向，生成 PDF/A 格式文件。

2250

AI-PDF GitHub/AI开源

Cody Former

一个开源的人工智能图像处理工具，Cody Former专注于面部修复、图片清晰化以及视频去除马赛克和修复。

2240

GitHub/AI开源

MimicMotion

腾讯和上交大出的，具有置信度感知姿势指导的高质量人体运动视频生成，MimicMotion可以生成任意长度、具有任何动作指导的高质量视频生成框架。

2230

GitHub/AI开源

EchoMimic

一个基于音频驱动的肖像动画生成工具，通过可编辑的特征点条件生成逼真、自然的动画，用户可以根据自己的需求调整动画细节。

2230

GitHub/AI开源

AnimateDiff

AnimateDiff 是一个能够将个性化的文本转换为图像的扩展模型，一款可以在stable diffusion中制作稳定gif动图的插件。

2210

GitHub/AI开源

Zero123

一种从单个图像到一致的多视图扩散基础模型，旨在使用单视图输入生成 3D 一致的多视图图像。

2210

GitHub/AI开源

中国大模型列表大全

中国大模型列表大全，全面收集有明确来源的大模型情况，包括机构、来源信息和分类等，随时更新。旨在记录中国大模型发展情况，欢迎在Issues中提供提供线索和素材。

2200

GitHub/AI开源

MagicEdit

MagicEdit 是字节跳动的一款视频编辑工具，它可以高保真度和时间连贯性地编辑视频，通过学习明确区分外观和动作。

2190

GitHub/AI开源

LiveSketch

LiveSketch是一款AI生成视频工具，用户通过文本提示将静态素描转化为动画，它提供了一种简单直观的方法，使他们的素描变得生动活泼。

2190

GitHub/AI开源 # Text-to-Video

Atomic Agents

一个适用于构建模块化、可扩展的AI代理开源框架，它将复杂的AI系统分解为最小的、不可分割的组件，并通过这些组件的灵活组合来构建强大的 AI 应用。

2190

GitHub/AI开源智能体

LabelU

一个开源的数据标注工具，可以帮助用户快速、准确、高效地对数据进行标注，从而提高机器学习模型的性能和质量。

2180

GitHub/AI开源

TokenFlow

一个利用预训练的文本到图像扩散模型进行视频编辑的框架。它无需进一步训练或微调，即可实现一致的视频编辑效果。

2180

GitHub/AI开源

Maple Mono

一款专注于优化编码体验的开源等宽字体，它提供无限的字体粗细和手工微调的斜体字形，圆角设计使其看起来丝滑舒适，特别适合长时间编码工作。

2180

GitHub/AI开源

Maxun.dev

一个无代码网页数据提取平台，可以可靠、大规模地从网站提取和自动化数据，能将任何网站转为实时数据馈送，Maxun.dev使用简便，不用编码，几分钟就可以上手。

2180

GitHub/AI开源工作流

Magic Resume

一个现代化的在线简历编辑器，它基于 Next.js 和 Framer Motion 构建，可以让用户能够轻松创建专业的简历。

2170

AI简历 GitHub/AI开源

FireRedASR

小红书FireRed 团队发布并开源的基于大模型的语音识别模型，它在中文普通话语音识别领域取得了新的SOTA，FireRedASR支持方言、英语及歌词识别。

2160

GitHub/AI开源