ClotheDreamer一个虚拟试穿项目,可以从文本生成可穿戴3D 服装,ClotheDreamer是上海大学、上海交通大学、复旦大学和腾讯优图实验室出的。最佳服饰零售商 1100GitHub/AI开源
FreeAskInternetFreeAskInternet 是一个完全免费、私有且本地运行的搜索聚合器,并使用 LLM 生成答案,无需 GPU。用户可以提出问题,系统将使用searxng进 1350GitHub/AI开源
QuickRecorder一款基于ScreenCapture Kit for macOS的轻量级录屏 工具/基于 ScreenCapture Kit的多功能、轻量化、高性能的开源macOS屏幕录制工具。 1670GitHub/AI开源
EZ-Work一款开源AI文档翻译助手,帮助用户使用 OpenAI 等大型语言模型API快速且经济高效地翻译文档。支持txt、word、csv、excel、pdf、ppt等多种文档格式的翻译,适用于各种需要文档翻译的场景。 1660GitHub/AI开源
Linly-Dubbing一款开源的多语言AI配音和视频翻译工具。Linly-Dubbing可以自动将视频翻译成其他语言并生成字幕、克隆视频中说话者的声音并自动配音、进行口型同步。 1430GitHub/AI开源
PDFMathTranslate一款开源的PDF文档翻译工具,专为翻译科技论文等PDF文件而设计。PDFMathTranslate能够完整保留原文的排版,包括公式和图表,并支持双语对照,保持原有目录结构。 1610AI-PDFGitHub/AI开源
卡卡字幕助手 | VideoCaptioner一款基于 LLM 的智能字幕助手,无需GPU一键高质量字幕视频合成!支持生成、断句、优化、翻译全流程。卡卡字幕助手让视频字幕制作简单高效!优化、翻译,字幕视频全流程一键处理! 1560GitHub/AI开源字幕# 字幕
VISION XL一款专注于视频质量修复与增强的全新工具,VISION XL利用潜在扩散模型来解决高清视频的逆问题,能够在资源要求较低的环境下提供出色的修复与超分辨率能力。 1240GitHub/AI开源
LogoCreator一款由开源达人Hassan打造的AI Logo设计工具,LogoCreator依托Together AI平台的Flux模型实现,为用户提供智能、高效的Logo生成功能。 1090GitHub/AI开源
Cherry Studio官网一款开源的支持多种大型语言模型(LLM)桌面AI客户端,集成了多个LLM,支持Ollama本地模型部署。 1920AI大模型GitHub/AI开源# GPT# LLM# 人工智能
FUZZ由Riffusion推出的一款基于扩散模型(Diffusion Model)的全新音乐生成模型,该工具能够通过“想象”生成音频的声谱图(Spectrogram),然后将其转换为音频。便携式音箱 1330GitHub/AI开源
Midscene.js一款基于AI的自动化浏览器助手,能够通过自然语言操作网页。你只需描述要执行的任务,Midscene.js会自动处理网页,如发推文、验证内容、搜索信息等功能。 1650GitHub/AI开源工作流/RPA
GitHub · Change is constant. GitHub keeps you ahead. · GitHubJoin the world's most widely adopted, AI-powered developer platform where millions of developers, businesses, and the largest open source community build software that advances humanity.1590AI大模型GitHub/AI开源
Step-Video-T2V一个由阶跃星辰与吉利汽车合作开源的先进文本到视频生成模型。支持中文与英文提示输入,应用于在如广告、影视制作、自动化内容创作等场景。 1270GitHub/AI开源图/文生视频
WeChat Bot基于WeChaty结合OpenAI ChatGPT、Kimi、讯飞等多种AI服务实现的开源微信机器人项目,用于自动回复微信消息或管理微信群/好友。 1700GitHub/AI开源自媒体
NeuraPress/Markdown编辑器一款专注于微信公众号排版的Markdown编辑器,支持移动端,搭配DeepSeek和微信公众号助手,利用碎片化时间,通过手机就能编辑并发布带有排版效果的公众号文章。 1380GitHub/AI开源排版/分发
Anda一个以Rust为基础构建的AI智能体框架,整合了ICP区块链并且支持TEE环境,Anda的目标在于构建一个能够高度组合、自主运行且拥有持续记忆能力的AI智能体网络。 1190GitHub/AI开源智能体
Arxiv-Markdown-Parser-Plugin一款能够一键将arXiv上的论文转换为Markdown格式的浏览器插件,无论该论文呈现的是摘要、PDF版本还是HTML版本。 1250AI论文GitHub/AI开源
SwiftChat一款基于React Native开发的快速、安全、跨平台聊天应用,支持实时流式聊天功能和Markdown语法,还可以生成AI图像,兼容DeepSeek、Amazon Bedrock、Ollama和OpenAI等模型。 1440GitHub/AI开源
Coze on WeChat一个基于微信平台开发的智能助手,主要对接 Coze 平台,支持大部分 Coze Bot 功能。它允许用户通过微信与 AI 聊天机器人进行交互,支持文本、语音等多种交互方式。 1440GitHub/AI开源智能体
Atomic Agents一个适用于构建模块化、可扩展的AI代理开源框架,它将复杂的AI系统分解为最小的、不可分割的组件,并通过这些组件的灵活组合来构建强大的 AI 应用。 1390GitHub/AI开源智能体
Motia一个专为开发者设计的AI代理框架,帮助开发者快速搭建、测试和部署生产级的 AI 代理。它强调代码优先和事件驱动,支持多语言开发,并提供可视化界面,使开发者能够专注于业务逻辑。 1570AI编程GitHub/AI开源
OCRmyPDF一款开源的命令行工具,用于给扫描的 PDF 文件添加可搜索的OCR文本层。它支持多语言,能优化图像、纠偏、清洁页面,并自动旋转方向,生成 PDF/A 格式文件。 1330AI-PDFGitHub/AI开源
MagicColor香港科技大学团开发的首个支持单次前向传播多实例集成的线稿上色框架,用户仅需上传一张黑白线稿和若干参考图像,系统便能在数秒内自动完成精准且自然的色彩填充。 1430GitHub/AI开源文/图生图
Droidrun一款可以通过AI代理实现Android设备的自动化操作开源框架,它结合视觉解析与UI结构提取技术,支持多种语言模型,可自动执行任务、处理复杂界面和动态UI。最佳智能手机 1480GitHub/AI开源工作流/RPA
PiliPala一款基于Flutter开发的B站开源第三方客户端。支持Android和iOS平台,提供无广告的高清视频播放体验,具备倍速播放、离线缓存、稍后再看等功能。 1320GitHub/AI开源自媒体
ResumeToJob一个免费开源的在线简历生成器,用户可以实时编辑简历并一键导出 PDF 文件,数据会保存在本地浏览器,并有多种好看的简历模板,手机和 电脑都能用。 1710AI简历GitHub/AI开源# open-source
Dual AI Chat一个聊天应用,核心设计是让两个不同风格的人工智能通过辩论协作生成回答。默认接入 Google Gemini API,同时兼容其他 OpenAI 标准的 API 接口,也支持本地模型或其他托管服务。 1380AI大模型GitHub/AI开源
ExplorerTabUtility一款 Windows 11 资源管理器多标签扩展工具,它能把新窗口都改成标签页,还带快捷键操作,文件资源管理器用起来就像浏览器一样方便,标签页也能搜、能批量管。 1350GitHub/AI开源自媒体
SuperClaudeSuperClaude 是一个为 Claude Code 量身打造的零门槛编程的上下文工程开源框架。它通过一系列专门设计的命令、认知角色和开发方法,可以大大增强Claude Code 的能力。 1290AI编程GitHub/AI开源
中国大模型列表大全中国大模型列表大全,全面收集有明确来源的大模型情况,包括机构、来源信息和分类等,随时更新。旨在记录中国大模型发展情况,欢迎在Issues中提供提供线索和素材。 1570GitHub/AI开源
UIGEN-T1一个基于 Qwen2.5-Coder-7B 模型微调的开源 UI 设计生成工具,能够根据用户输入的提示生成结构清晰且符合标准的 HTML 和 CSS 代码 1180AI编程GitHub/AI开源
IndexTTSB站基于XTTS和Tortoise开发的文本转语音模型,具备工业级零样本TTS能力。针对中文场景创新采用字符-拼音混合建模,可快速修正发音错误。 1720GitHub/AI开源文字&语音
Eigent AI全球首个桌面端多智能体生产力平台,采用多智能体协作架构,通过拆分任务、并行处理来提高复杂任务的执行效率,支持本地部署和云端运行,还有人类参与机制,能保证结果准确可靠。 1520AI编程GitHub/AI开源
Maxun.dev一个无代码网页数据提取平台,可以可靠、大规模地从网站提取和自动化数据,能将任何网站转为实时数据馈送,Maxun.dev使用简便,不用编码,几分钟就可以上手。 1330GitHub/AI开源工作流/RPA
BrowserOS一款基于 Chromium 内核带 AI 代理功能的浏览器,能自动完成在线购物、信息收集等多种网页操作。它支持本地 Ollama 模型,保护用户隐私。 1200GitHub/AI开源工作流/RPA
StableAvatar复旦大学、微软亚洲研究院和西安交通大学等机构的研究人员开发的一个能通过音频直接生成唱歌或说话视频的工具,而且视频时长不受限制,画面质量也很高。 1180GitHub/AI开源图/文生视频
Archon一个能让AI 自动生成和优化其他AI代理的开源工具。作为首款 “Agenteer”,Archon 第六版支持多种工具库和 MCP 服务器集成,让生成的AI更高效可靠。 1240AI编程GitHub/AI开源
Klic StudioKrillin AI推出的视频翻译和配音工具,它支持100多种语言的翻译和配音,有AI同步口型、自然声音克隆功能,还能把音频/视频转成文字。 1680AI翻译GitHub/AI开源
React-Tetris一个用 React 框架开发的经典俄罗斯方块游戏。它用了组件化设计,能键盘控制,也能适配不同屏幕,既可以嵌入 React 应用,也能当独立组件用。 1170GitHub/AI开源
ChopperBot一款能用于像虎牙、斗鱼、抖音、BiliBili、TikTok、Twitch 等平台的智能直播视频剪辑发布工具,能实现自动化视频剪辑和自动化切片操作,而且非常智能。 1670GitHub/AI开源工作流/RPA
ValueCell AI全球首个开源金融智能体平台,采用社区驱动和多智能体模式,ValueCell提供选股、分析、新闻推送、市场研究、数据收集、情绪分析、策略生成等功能。 1540GitHub/AI开源
BongoCat一款轻量级、开源且跨平台的桌面猫咪宠物应用,由开发者ayoungweb 制作,它通过可爱的猫咪形象与用户互动,能根据键盘敲击和鼠标操作做出反应。交互式宠物 5090GitHub/AI开源
LandPPT一个基于大语言模型的开源免费AIPPT生成平台,支持将文档内容自动转为专业PPT,具备多AI模型支持、智能文档处理、智能配图、深度研究等功能。 1540AI-PPTGitHub/AI开源# AI PPT# LLM
Windrecorder捕风记录仪,一款开源的屏幕录制与检索工具,它记录屏幕内容来实现记忆搜索,帮用户检索记忆线索,支持按OCR文本或画面描述查询,还提供活动统计等功能。 1180GitHub/AI开源