Archon一个能让AI 自动生成和优化其他AI代理的开源工具。作为首款 “Agenteer”,Archon 第六版支持多种工具库和 MCP 服务器集成,让生成的AI更高效可靠。 660GitHub/AI开源MCP
DreamTalk一个由清华大学、阿里巴巴和华中科大共同开发的一个基于扩散模型可以让人物照片说话,支持包括歌曲、多种语言的语音、嘈杂的音频在内的各种声音匹配让人物头像说话的框架。 690GitHub/AI开源
Streamer-Sales销冠销冠,卖货主播 LLM 大模型,Streamer-Sales就一款能够根据给定的商品特点从激发用户购买意愿角度出发进行商品解说的卖货主播大模型。 690GitHub/AI开源
NeuraPress/Markdown编辑器一款专注于微信公众号排版的Markdown编辑器,支持移动端,搭配DeepSeek和微信公众号助手,利用碎片化时间,通过手机就能编辑并发布带有排版效果的公众号文章。 780GitHub/AI开源排版/分发# 排版
Hyprnote一个开源的会议笔记AI工具,适合经常参加会议的人使用。Hyprnote能实时把会议内容录下来并转成文字,还能整理出会议要点。 740AI会议纪要GitHub/AI开源# ai meeting assistant# compliance-friendly AI notetaker# enterprise AI notetaker
TryOnDiffusionTryOnDiffusion就谷歌推出的一项新虚拟试穿功能,能够实现高度逼真的虚拟试穿,用户能够直观地看到不同体型的人穿着不同尺寸的衣服效果如何。 670GitHub/AI开源
TokenFlow一个利用预训练的文本到图像扩散模型进行视频编辑的框架。它无需进一步训练或微调,即可实现一致的视频编辑效果。 650GitHub/AI开源# KEYWORDS SHOULD BE PLACED HERE
Ncurator/馆长知识库AI问答助手,让AI帮助你整理与分析知识,馆长基于语义和关键词搜索技术,当你输入问题时,馆长智能分析你的查询,并从你的知识库中检索出最相关的信息。 910GitHub/AI开源# AI# AI assistant# GPT
IP-Adapter-FaceID该模型利用面部识别模型的面部ID嵌入,可以更准确地捕捉和再现特定人物的面部特征。IP-Adapter-FaceID结合文本描述生成可以生成高度个性化且与原始面部特征一致的图像。 600GitHub/AI开源
Personalized Restoration一个面部图像精准恢复和个性编辑技术工具,不仅能复原受损图像细节,同时能精准捕捉和重现个人独特的面部特征。同时它还支持换脸。 610GitHub/AI开源# identity-aware image restoration# Personalized diffusion
LiveSketchLiveSketch是一款AI生成视频工具,用户通过文本提示将静态素描转化为动画,它提供了一种简单直观的方法,使他们的素描变得生动活泼。 730GitHub/AI开源# animation# sketch# Text-to-Video
GenAI_Agents一个专注于生成式AI Agents技术的开源项目,GenAI_Agents提供从基础到高级的教程与实现代码,帮助开发者学习并构建智能、交互式的AI系统。 760GitHub/AI开源
LogoCreator一款由开源达人Hassan打造的AI Logo设计工具,LogoCreator依托Together AI平台的Flux模型实现,为用户提供智能、高效的Logo生成功能。 630GitHub/AI开源
YouDub-Webui一款开源的多语言AI配音和视频翻译工具,优质视频中文化工具,YouDub-webui提供了一套完整的视频中文化工具包,涵盖了从视频下载、语音识别、字幕翻译、AI声音克隆、视频处理、自动上传等一系列流程。 810GitHub/AI开源
BrowserOS一款基于 Chromium 内核带 AI 代理功能的浏览器,能自动完成在线购物、信息收集等多种网页操作。它支持本地 Ollama 模型,保护用户隐私。 660GitHub/AI开源工作流/RPA# 工作流浏览器
DeepSeek官方工具箱由 DeepSeek官方团队维护的开源项目,提供与 DeepSeek API 集成的各种工具和资源,应用程序、AI Agent 框架、RAG 框架、浏览器插件、VS Code 插件等。 740GitHub/AI开源
RTranslator一款开源、免费、离线的 Android 实时翻译应用程序。连接到拥有该应用程序的人,连接蓝牙耳机,将手机放入口袋中,然后您就可以像对方说您的语言一样进行对话。最佳智能手机 880GitHub/AI开源
ExplorerTabUtility一款 Windows 11 资源管理器多标签扩展工具,它能把新窗口都改成标签页,还带快捷键操作,文件资源管理器用起来就像浏览器一样方便,标签页也能搜、能批量管。 780GitHub/AI开源自媒体# 标签页管理
Linly-Dubbing一款开源的多语言AI配音和视频翻译工具。Linly-Dubbing可以自动将视频翻译成其他语言并生成字幕、克隆视频中说话者的声音并自动配音、进行口型同步。 810GitHub/AI开源
Awesome GPT-4o Images一个精选的GPT-4o生成图片集锦,收集了OpenAI 最新多模态模型 GPT‑4o 生成的精彩案例,展示其强大的文本‑图像理解与创作能力。 630GitHub/AI开源
StableAvatar复旦大学、微软亚洲研究院和西安交通大学等机构的研究人员开发的一个能通过音频直接生成唱歌或说话视频的工具,而且视频时长不受限制,画面质量也很高。 620GitHub/AI开源图/文生视频
SwiftChat一款基于React Native开发的快速、安全、跨平台聊天应用,支持实时流式聊天功能和Markdown语法,还可以生成AI图像,兼容DeepSeek、Amazon Bedrock、Ollama和OpenAI等模型。 750GitHub/AI开源
Automa一款开源的低代码/无代码浏览器自动化工具,用户可以通过可视化界面,像搭积木一样将各种功能模块连接起来,构建自定义的自动化流程。 1220GitHub/AI开源工作流/RPA# AI RPA# AI workflow builder# AI-driven robotic process automation
BongoCat一款轻量级、开源且跨平台的桌面猫咪宠物应用,由开发者ayoungweb 制作,它通过可爱的猫咪形象与用户互动,能根据键盘敲击和鼠标操作做出反应。交互式宠物 3160GitHub/AI开源
Coze on WeChat一个基于微信平台开发的智能助手,主要对接 Coze 平台,支持大部分 Coze Bot 功能。它允许用户通过微信与 AI 聊天机器人进行交互,支持文本、语音等多种交互方式。 700GitHub/AI开源智能体
AI Comic FactoryAI Comic Factory是一个免费开源的AI漫画生成器,使用LLM + SDXL开发。它能够根据用户提供的提示词生成漫画,并支持无损放大、保存和打印。 720GitHub/AI开源