Open WebUI一个可扩展、功能丰富且用户友好的自托管 WebUI,适用于各种 LLM 运行器,支持的 LLM 运行器包括 Ollama 和 OpenAI 兼容的 API。 1160GitHub/AI开源
Animagine XL 3.1一个开源的文本生成图像动漫模型,通过整合新的数据集,Animagine XL 3.1扩展了对广泛动漫作品和风格的理解,从经典作品到最新发布的动漫,覆盖了从古老到现代的各种艺术风格。 1170GitHub/AI开源
StreamMultiDiffusion一种基于区域语义控制的实时交互生成图像方法,主要用于图像生成和编辑应用。它基于扩散模型在文本到图像合成中的成功,旨在通过减少推理时间和提高生成图像的质量来提高扩散模型的可用性。 1420GitHub/AI开源
XHS-Downloader小红书链接提取/作品采集工具:提取账号发布、收藏、点赞作品链接;提取搜索结果作品链接、用户链接;采集小红书作品信息;提取小红书作品下载地址;下载小红书无水印作品文件! 1950GitHub/AI开源
RTranslator一款开源、免费、离线的 Android 实时翻译应用程序。连接到拥有该应用程序的人,连接蓝牙耳机,将手机放入口袋中,然后您就可以像对方说您的语言一样进行对话。最佳智能手机 1660GitHub/AI开源
Streamer-Sales销冠销冠,卖货主播 LLM 大模型,Streamer-Sales就一款能够根据给定的商品特点从激发用户购买意愿角度出发进行商品解说的卖货主播大模型。 1200GitHub/AI开源
ClotheDreamer一个虚拟试穿项目,可以从文本生成可穿戴3D 服装,ClotheDreamer是上海大学、上海交通大学、复旦大学和腾讯优图实验室出的。最佳服饰零售商 1100GitHub/AI开源
FreeAskInternetFreeAskInternet 是一个完全免费、私有且本地运行的搜索聚合器,并使用 LLM 生成答案,无需 GPU。用户可以提出问题,系统将使用searxng进 1350GitHub/AI开源
QuickRecorder一款基于ScreenCapture Kit for macOS的轻量级录屏 工具/基于 ScreenCapture Kit的多功能、轻量化、高性能的开源macOS屏幕录制工具。 1670GitHub/AI开源
EZ-Work一款开源AI文档翻译助手,帮助用户使用 OpenAI 等大型语言模型API快速且经济高效地翻译文档。支持txt、word、csv、excel、pdf、ppt等多种文档格式的翻译,适用于各种需要文档翻译的场景。 1660GitHub/AI开源
Linly-Dubbing一款开源的多语言AI配音和视频翻译工具。Linly-Dubbing可以自动将视频翻译成其他语言并生成字幕、克隆视频中说话者的声音并自动配音、进行口型同步。 1430GitHub/AI开源
PDFMathTranslate一款开源的PDF文档翻译工具,专为翻译科技论文等PDF文件而设计。PDFMathTranslate能够完整保留原文的排版,包括公式和图表,并支持双语对照,保持原有目录结构。 1610AI-PDFGitHub/AI开源
VISION XL一款专注于视频质量修复与增强的全新工具,VISION XL利用潜在扩散模型来解决高清视频的逆问题,能够在资源要求较低的环境下提供出色的修复与超分辨率能力。 1240GitHub/AI开源
LogoCreator一款由开源达人Hassan打造的AI Logo设计工具,LogoCreator依托Together AI平台的Flux模型实现,为用户提供智能、高效的Logo生成功能。 1090GitHub/AI开源
Cherry Studio官网一款开源的支持多种大型语言模型(LLM)桌面AI客户端,集成了多个LLM,支持Ollama本地模型部署。 1920AI大模型GitHub/AI开源# GPT# LLM# 人工智能
FUZZ由Riffusion推出的一款基于扩散模型(Diffusion Model)的全新音乐生成模型,该工具能够通过“想象”生成音频的声谱图(Spectrogram),然后将其转换为音频。便携式音箱 1330GitHub/AI开源
Midscene.js一款基于AI的自动化浏览器助手,能够通过自然语言操作网页。你只需描述要执行的任务,Midscene.js会自动处理网页,如发推文、验证内容、搜索信息等功能。 1650GitHub/AI开源工作流/RPA
GitHub · Change is constant. GitHub keeps you ahead. · GitHubJoin the world's most widely adopted, AI-powered developer platform where millions of developers, businesses, and the largest open source community build software that advances humanity.1590AI大模型GitHub/AI开源
Step-Video-T2V一个由阶跃星辰与吉利汽车合作开源的先进文本到视频生成模型。支持中文与英文提示输入,应用于在如广告、影视制作、自动化内容创作等场景。 1270GitHub/AI开源图/文生视频
Anda一个以Rust为基础构建的AI智能体框架,整合了ICP区块链并且支持TEE环境,Anda的目标在于构建一个能够高度组合、自主运行且拥有持续记忆能力的AI智能体网络。 1190GitHub/AI开源智能体
Arxiv-Markdown-Parser-Plugin一款能够一键将arXiv上的论文转换为Markdown格式的浏览器插件,无论该论文呈现的是摘要、PDF版本还是HTML版本。 1250AI论文GitHub/AI开源
SwiftChat一款基于React Native开发的快速、安全、跨平台聊天应用,支持实时流式聊天功能和Markdown语法,还可以生成AI图像,兼容DeepSeek、Amazon Bedrock、Ollama和OpenAI等模型。 1440GitHub/AI开源
Coze on WeChat一个基于微信平台开发的智能助手,主要对接 Coze 平台,支持大部分 Coze Bot 功能。它允许用户通过微信与 AI 聊天机器人进行交互,支持文本、语音等多种交互方式。 1440GitHub/AI开源智能体
Atomic Agents一个适用于构建模块化、可扩展的AI代理开源框架,它将复杂的AI系统分解为最小的、不可分割的组件,并通过这些组件的灵活组合来构建强大的 AI 应用。 1390GitHub/AI开源智能体
Motia一个专为开发者设计的AI代理框架,帮助开发者快速搭建、测试和部署生产级的 AI 代理。它强调代码优先和事件驱动,支持多语言开发,并提供可视化界面,使开发者能够专注于业务逻辑。 1570AI编程GitHub/AI开源
OCRmyPDF一款开源的命令行工具,用于给扫描的 PDF 文件添加可搜索的OCR文本层。它支持多语言,能优化图像、纠偏、清洁页面,并自动旋转方向,生成 PDF/A 格式文件。 1330AI-PDFGitHub/AI开源
Droidrun一款可以通过AI代理实现Android设备的自动化操作开源框架,它结合视觉解析与UI结构提取技术,支持多种语言模型,可自动执行任务、处理复杂界面和动态UI。最佳智能手机 1480GitHub/AI开源工作流/RPA
ResumeToJob一个免费开源的在线简历生成器,用户可以实时编辑简历并一键导出 PDF 文件,数据会保存在本地浏览器,并有多种好看的简历模板,手机和 电脑都能用。 1710AI简历GitHub/AI开源# open-source
Dual AI Chat一个聊天应用,核心设计是让两个不同风格的人工智能通过辩论协作生成回答。默认接入 Google Gemini API,同时兼容其他 OpenAI 标准的 API 接口,也支持本地模型或其他托管服务。 1380AI大模型GitHub/AI开源
SuperClaudeSuperClaude 是一个为 Claude Code 量身打造的零门槛编程的上下文工程开源框架。它通过一系列专门设计的命令、认知角色和开发方法,可以大大增强Claude Code 的能力。 1290AI编程GitHub/AI开源
中国大模型列表大全中国大模型列表大全,全面收集有明确来源的大模型情况,包括机构、来源信息和分类等,随时更新。旨在记录中国大模型发展情况,欢迎在Issues中提供提供线索和素材。 1570GitHub/AI开源
UIGEN-T1一个基于 Qwen2.5-Coder-7B 模型微调的开源 UI 设计生成工具,能够根据用户输入的提示生成结构清晰且符合标准的 HTML 和 CSS 代码 1180AI编程GitHub/AI开源
IndexTTSB站基于XTTS和Tortoise开发的文本转语音模型,具备工业级零样本TTS能力。针对中文场景创新采用字符-拼音混合建模,可快速修正发音错误。 1720GitHub/AI开源文字&语音
Maxun.dev一个无代码网页数据提取平台,可以可靠、大规模地从网站提取和自动化数据,能将任何网站转为实时数据馈送,Maxun.dev使用简便,不用编码,几分钟就可以上手。 1330GitHub/AI开源工作流/RPA
StableAvatar复旦大学、微软亚洲研究院和西安交通大学等机构的研究人员开发的一个能通过音频直接生成唱歌或说话视频的工具,而且视频时长不受限制,画面质量也很高。 1180GitHub/AI开源图/文生视频
Klic StudioKrillin AI推出的视频翻译和配音工具,它支持100多种语言的翻译和配音,有AI同步口型、自然声音克隆功能,还能把音频/视频转成文字。 1680AI翻译GitHub/AI开源
React-Tetris一个用 React 框架开发的经典俄罗斯方块游戏。它用了组件化设计,能键盘控制,也能适配不同屏幕,既可以嵌入 React 应用,也能当独立组件用。 1170GitHub/AI开源
ValueCell AI全球首个开源金融智能体平台,采用社区驱动和多智能体模式,ValueCell提供选股、分析、新闻推送、市场研究、数据收集、情绪分析、策略生成等功能。 1540GitHub/AI开源
BongoCat一款轻量级、开源且跨平台的桌面猫咪宠物应用,由开发者ayoungweb 制作,它通过可爱的猫咪形象与用户互动,能根据键盘敲击和鼠标操作做出反应。交互式宠物 5090GitHub/AI开源
LandPPT一个基于大语言模型的开源免费AIPPT生成平台,支持将文档内容自动转为专业PPT,具备多AI模型支持、智能文档处理、智能配图、深度研究等功能。 1540AI-PPTGitHub/AI开源# AI PPT# LLM
Windrecorder捕风记录仪,一款开源的屏幕录制与检索工具,它记录屏幕内容来实现记忆搜索,帮用户检索记忆线索,支持按OCR文本或画面描述查询,还提供活动统计等功能。 1180GitHub/AI开源