卡卡字幕助手 | VideoCaptioner一款基于 LLM 的智能字幕助手,无需GPU一键高质量字幕视频合成!支持生成、断句、优化、翻译全流程。卡卡字幕助手让视频字幕制作简单高效!优化、翻译,字幕视频全流程一键处理! 1560GitHub/AI开源字幕# 字幕
NeuraPress/Markdown编辑器一款专注于微信公众号排版的Markdown编辑器,支持移动端,搭配DeepSeek和微信公众号助手,利用碎片化时间,通过手机就能编辑并发布带有排版效果的公众号文章。 1380GitHub/AI开源排版/分发
ChopperBot一款能用于像虎牙、斗鱼、抖音、BiliBili、TikTok、Twitch 等平台的智能直播视频剪辑发布工具,能实现自动化视频剪辑和自动化切片操作,而且非常智能。 1670GitHub/AI开源工作流/RPA
BrowserOS一款基于 Chromium 内核带 AI 代理功能的浏览器,能自动完成在线购物、信息收集等多种网页操作。它支持本地 Ollama 模型,保护用户隐私。 1200GitHub/AI开源工作流/RPA
ExplorerTabUtility一款 Windows 11 资源管理器多标签扩展工具,它能把新窗口都改成标签页,还带快捷键操作,文件资源管理器用起来就像浏览器一样方便,标签页也能搜、能批量管。 1350GitHub/AI开源自媒体
PiliPala一款基于Flutter开发的B站开源第三方客户端。支持Android和iOS平台,提供无广告的高清视频播放体验,具备倍速播放、离线缓存、稍后再看等功能。 1320GitHub/AI开源自媒体
WeChat Bot基于WeChaty结合OpenAI ChatGPT、Kimi、讯飞等多种AI服务实现的开源微信机器人项目,用于自动回复微信消息或管理微信群/好友。 1700GitHub/AI开源自媒体
SuperTinyIcons一个收集了丰富 Logo的SVG 图标库,目前已收集386+ 个主流的品牌和产品的 Logo,包括GitHub、Twitter、Facebook等。适合用于网页设计、移动应用开发。 1230GitHub/AI开源插画/SVG
MagicColor香港科技大学团开发的首个支持单次前向传播多实例集成的线稿上色框架,用户仅需上传一张黑白线稿和若干参考图像,系统便能在数秒内自动完成精准且自然的色彩填充。 1420GitHub/AI开源文/图生图
PDF补丁丁|PDFPatcherPDFPatcher,是国内开发者wmjordan用.NET框架开发的PDF工具,能帮咱们处理日常办公、学习和整理文档时遇到的PDF问题。 1250AI-PDFGitHub/AI开源
Quick Prompt一个专注于提示词(Prompt)的管理和快速输入的浏览器扩展插件。可以帮助用户创建、管理和组织自己的提示词库,并在任何网页输入框中快速插入预设的提示词内容。 1370GitHub/AI开源谷歌插件
Ncurator/馆长知识库AI问答助手,让AI帮助你整理与分析知识,馆长基于语义和关键词搜索技术,当你输入问题时,馆长智能分析你的查询,并从你的知识库中检索出最相关的信息。 1440GitHub/AI开源# AI# GPT
Awesome LLM Apps一个精选的LLM(大型语言模型)应用集合,汇集了使用OpenAI、Anthropic、Google、Gemini以及开源模型(如DeepSeek、Qwen或Llama)构建的LLM应用。 1350GitHub/AI开源
GenAI_Agents一个专注于生成式AI Agents技术的开源项目,GenAI_Agents提供从基础到高级的教程与实现代码,帮助开发者学习并构建智能、交互式的AI系统。 1750GitHub/AI开源
LLM Engineer Toolkit一个精心整理的LLM 工具库,它将120多个与LLM相关的库按照功能和用途进行了细致分类,涵盖了从训练微调、应用开发、推理服务到安全评估等 LLM 开发全流程所需的工具。 1330GitHub/AI开源
Awesome LangGraph一份精心整理的 LangGraph 资源合集,涵盖了基础介绍、入门模板、示例应用、实用工具等资源、以及整理一些如智能体、AI 助手、开发与工具、内容与媒体、知识与检索等优秀项目。 1220GitHub/AI开源
Build Your Own X一个帮助开发者提升编程能力的开源项目,Build Your Own X提供了丰富的教程和资源,用户通过从零开始重新实现各种技术(如Web服务器、数据库、操作系统等)。 1250GitHub/AI开源
Awesome MCP ZH一个专为中文用户打造的 MCP资源合集! 包括有 MCP 的基础介绍、玩法、客户端、服务器和社区资源,帮你快速上手这个 AI 界的“万能插头”。 1210GitHub/AI开源
Awesome GPT-4o Images一个精选的GPT-4o生成图片集锦,收集了OpenAI 最新多模态模型 GPT‑4o 生成的精彩案例,展示其强大的文本‑图像理解与创作能力。 1040GitHub/AI开源
DeepSeek官方工具箱由 DeepSeek官方团队维护的开源项目,提供与 DeepSeek API 集成的各种工具和资源,应用程序、AI Agent 框架、RAG 框架、浏览器插件、VS Code 插件等。 1460GitHub/AI开源
AI Comic FactoryAI Comic Factory是一个免费开源的AI漫画生成器,使用LLM + SDXL开发。它能够根据用户提供的提示词生成漫画,并支持无损放大、保存和打印。 1510GitHub/AI开源
Platon.AI – 柏拉图智能Platon.AI柏拉图智能不仅仅是 AI 爬虫,也是 AI agents 的基础设施。 AI agents 要使用工具,就必须高速阅读理解在线网页,理解网页上的每一个元素——这就是 platon.AI 的技术。 1290GitHub/AI开源
Chatbot UI一个开源的聊天机器人Web UI框架,Chatbot UI提供 OpenAI 的 ChatGPT UI 的改进版本。提供了一个简单的用户界面,具有新对话、新聊天、导入数据、导出数据、设置和插件键等功能。 1280GitHub/AI开源
PDF-Guru一个通用型PDF文件处理工具,PDF-Guru包含PDF合并、拆分、旋转、水印、加密、转换等20多项常用功能,完全开源,个人免费使用,界面简洁,简单易用。 1540GitHub/AI开源
YouDub-Webui一款开源的多语言AI配音和视频翻译工具,优质视频中文化工具,YouDub-webui提供了一套完整的视频中文化工具包,涵盖了从视频下载、语音识别、字幕翻译、AI声音克隆、视频处理、自动上传等一系列流程。 1690GitHub/AI开源
FireRedASR小红书FireRed 团队发布并开源的基于大模型的语音识别模型,它在中文普通话语音识别领域取得了新的SOTA,FireRedASR支持方言、英语及歌词识别。 1300GitHub/AI开源
TryOnDiffusionTryOnDiffusion就谷歌推出的一项新虚拟试穿功能,能够实现高度逼真的虚拟试穿,用户能够直观地看到不同体型的人穿着不同尺寸的衣服效果如何。 1190GitHub/AI开源
AIdeaAIdea 是一款支持 GPT 以及国产大语言模型通义千问、文心一言等,支持 Stable Diffusion 文生图、图生图、 SDXL1.0、超分辨率、图片上色的全能型完全开源APP。 1120GitHub/AI开源
Whisper语音识别模型Whisper 是一种通用的语音识别模型。它在不同音频的大型数据集上进行训练,也是一个多任务模型,可以执行多语言语音识别以及语音翻译和语言识别。 1410AI大模型GitHub/AI开源
易魔声EmotiVoice易魔声EmotiVoice是一个强大的开源TTS引擎,支持中英文双语,包含2000多种不同的音色,以及特色的情感合成功能,支持合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音。 1240GitHub/AI开源
Notebook Copilot有了 Notebook CoPilot,开发笔记本的过程变得更加容易。这个简单的工具可以毫不费力地根据您的输入生成代码和 Markdown 单元格,从而显着简化您的工作流程。 1020GitHub/AI开源
VideoSrtVideoSrt是一个可以识别视频语音自动生成字幕 SRT文件的开源软件工具。适用于快速、批量的为媒体(视频/音频)生成中/英文字幕、文本文件的业务场景。 1630GitHub/AI开源
Deepfakes CreatorDeepfakes Creator,可以通过文本输入生成逼真的会说话的真人视频。用户只需要上传想要化身模仿的人的照片,并写一个剧本,工具就能创建出逼真的人物化身视频,模拟人物说话。 1470GitHub/AI开源
InvokeAIInvokeAI 是一个开源项目,是 Stable Diffusion 模型的领先创意引擎,它为使用 Stable Diffusion 模型生成高质量图像提供了简化的过程。 1120GitHub/AI开源
LiveSketchLiveSketch是一款AI生成视频工具,用户通过文本提示将静态素描转化为动画,它提供了一种简单直观的方法,使他们的素描变得生动活泼。 1400GitHub/AI开源# Text-to-Video
ComfyUI Portrait Master简体中文版ComfyUI Portrait Master 肖像大师简体中文版。超详细参数设置!再也不用为不会写人像提示词发愁!重新优化为ison列表更方便自定义和扩展。 1210GitHub/AI开源
HandRefiner解决AI图像生成中手部畸形的问题 目前的图像生成模型,再生成图像方面已经非常出色,但在生成人类手部的图像时却常常出现问题,比如手指数量不对或者手形怪异。 1000GitHub/AI开源
DreamTalk一个由清华大学、阿里巴巴和华中科大共同开发的一个基于扩散模型可以让人物照片说话,支持包括歌曲、多种语言的语音、嘈杂的音频在内的各种声音匹配让人物头像说话的框架。 1190GitHub/AI开源
IP-Adapter-FaceID该模型利用面部识别模型的面部ID嵌入,可以更准确地捕捉和再现特定人物的面部特征。IP-Adapter-FaceID结合文本描述生成可以生成高度个性化且与原始面部特征一致的图像。 1140GitHub/AI开源
QAnything AI网易有道一个开源的本地知识库问答系统,旨在支持多种文件格式和数据库,允许离线安装和使用。 ,电子邮件(eml),TXT(txt),图像(jpg,jpeg,png),CSV(csv),网页链接(html)1140AI大模型GitHub/AI开源# 智能写作
Personalized Restoration一个面部图像精准恢复和个性编辑技术工具,不仅能复原受损图像细节,同时能精准捕捉和重现个人独特的面部特征。同时它还支持换脸。 1080GitHub/AI开源
MotionshopAI角色动画工具,通过先进的视频处理和3D渲染技术,MotionShop能够高效地将视频中的某个角色替换为3D人物,同时不改变视频中的其他场景和人物。 1530GitHub/AI开源# 模型
Open WebUI一个可扩展、功能丰富且用户友好的自托管 WebUI,适用于各种 LLM 运行器,支持的 LLM 运行器包括 Ollama 和 OpenAI 兼容的 API。 1160GitHub/AI开源