IP-Adapter-FaceID该模型利用面部识别模型的面部ID嵌入,可以更准确地捕捉和再现特定人物的面部特征。IP-Adapter-FaceID结合文本描述生成可以生成高度个性化且与原始面部特征一致的图像。 1140GitHub/AI开源
Windrecorder捕风记录仪,一款开源的屏幕录制与检索工具,它记录屏幕内容来实现记忆搜索,帮用户检索记忆线索,支持按OCR文本或画面描述查询,还提供活动统计等功能。 1180GitHub/AI开源
FreeAskInternetFreeAskInternet 是一个完全免费、私有且本地运行的搜索聚合器,并使用 LLM 生成答案,无需 GPU。用户可以提出问题,系统将使用searxng进 1350GitHub/AI开源
PiliPala一款基于Flutter开发的B站开源第三方客户端。支持Android和iOS平台,提供无广告的高清视频播放体验,具备倍速播放、离线缓存、稍后再看等功能。 1320GitHub/AI开源自媒体
ClotheDreamer一个虚拟试穿项目,可以从文本生成可穿戴3D 服装,ClotheDreamer是上海大学、上海交通大学、复旦大学和腾讯优图实验室出的。最佳服饰零售商 1100GitHub/AI开源
Awesome LangGraph一份精心整理的 LangGraph 资源合集,涵盖了基础介绍、入门模板、示例应用、实用工具等资源、以及整理一些如智能体、AI 助手、开发与工具、内容与媒体、知识与检索等优秀项目。 1220GitHub/AI开源
NeuraPress/Markdown编辑器一款专注于微信公众号排版的Markdown编辑器,支持移动端,搭配DeepSeek和微信公众号助手,利用碎片化时间,通过手机就能编辑并发布带有排版效果的公众号文章。 1380GitHub/AI开源排版/分发
中国大模型列表大全中国大模型列表大全,全面收集有明确来源的大模型情况,包括机构、来源信息和分类等,随时更新。旨在记录中国大模型发展情况,欢迎在Issues中提供提供线索和素材。 1570GitHub/AI开源
AI Comic FactoryAI Comic Factory是一个免费开源的AI漫画生成器,使用LLM + SDXL开发。它能够根据用户提供的提示词生成漫画,并支持无损放大、保存和打印。 1510GitHub/AI开源
Awesome GPT-4o Images一个精选的GPT-4o生成图片集锦,收集了OpenAI 最新多模态模型 GPT‑4o 生成的精彩案例,展示其强大的文本‑图像理解与创作能力。 1040GitHub/AI开源
LLM Engineer Toolkit一个精心整理的LLM 工具库,它将120多个与LLM相关的库按照功能和用途进行了细致分类,涵盖了从训练微调、应用开发、推理服务到安全评估等 LLM 开发全流程所需的工具。 1330GitHub/AI开源
LogoCreator一款由开源达人Hassan打造的AI Logo设计工具,LogoCreator依托Together AI平台的Flux模型实现,为用户提供智能、高效的Logo生成功能。 1090GitHub/AI开源
QAnything AI网易有道一个开源的本地知识库问答系统,旨在支持多种文件格式和数据库,允许离线安装和使用。 ,电子邮件(eml),TXT(txt),图像(jpg,jpeg,png),CSV(csv),网页链接(html)1140AI大模型GitHub/AI开源# 智能写作
Midscene.js一款基于AI的自动化浏览器助手,能够通过自然语言操作网页。你只需描述要执行的任务,Midscene.js会自动处理网页,如发推文、验证内容、搜索信息等功能。 1650GitHub/AI开源工作流/RPA
Quick Prompt一个专注于提示词(Prompt)的管理和快速输入的浏览器扩展插件。可以帮助用户创建、管理和组织自己的提示词库,并在任何网页输入框中快速插入预设的提示词内容。 1370GitHub/AI开源谷歌插件
GenAI_Agents一个专注于生成式AI Agents技术的开源项目,GenAI_Agents提供从基础到高级的教程与实现代码,帮助开发者学习并构建智能、交互式的AI系统。 1750GitHub/AI开源
StableAvatar复旦大学、微软亚洲研究院和西安交通大学等机构的研究人员开发的一个能通过音频直接生成唱歌或说话视频的工具,而且视频时长不受限制,画面质量也很高。 1180GitHub/AI开源图/文生视频
UIGEN-T1一个基于 Qwen2.5-Coder-7B 模型微调的开源 UI 设计生成工具,能够根据用户输入的提示生成结构清晰且符合标准的 HTML 和 CSS 代码 1180AI编程GitHub/AI开源
Streamer-Sales销冠销冠,卖货主播 LLM 大模型,Streamer-Sales就一款能够根据给定的商品特点从激发用户购买意愿角度出发进行商品解说的卖货主播大模型。 1200GitHub/AI开源
HandRefiner解决AI图像生成中手部畸形的问题 目前的图像生成模型,再生成图像方面已经非常出色,但在生成人类手部的图像时却常常出现问题,比如手指数量不对或者手形怪异。 1000GitHub/AI开源
BongoCat一款轻量级、开源且跨平台的桌面猫咪宠物应用,由开发者ayoungweb 制作,它通过可爱的猫咪形象与用户互动,能根据键盘敲击和鼠标操作做出反应。交互式宠物 5090GitHub/AI开源
LiveSketchLiveSketch是一款AI生成视频工具,用户通过文本提示将静态素描转化为动画,它提供了一种简单直观的方法,使他们的素描变得生动活泼。 1400GitHub/AI开源# Text-to-Video
Maxun.dev一个无代码网页数据提取平台,可以可靠、大规模地从网站提取和自动化数据,能将任何网站转为实时数据馈送,Maxun.dev使用简便,不用编码,几分钟就可以上手。 1330GitHub/AI开源工作流/RPA
Linly-Dubbing一款开源的多语言AI配音和视频翻译工具。Linly-Dubbing可以自动将视频翻译成其他语言并生成字幕、克隆视频中说话者的声音并自动配音、进行口型同步。 1430GitHub/AI开源
Deepfakes CreatorDeepfakes Creator,可以通过文本输入生成逼真的会说话的真人视频。用户只需要上传想要化身模仿的人的照片,并写一个剧本,工具就能创建出逼真的人物化身视频,模拟人物说话。 1470GitHub/AI开源
OCRmyPDF一款开源的命令行工具,用于给扫描的 PDF 文件添加可搜索的OCR文本层。它支持多语言,能优化图像、纠偏、清洁页面,并自动旋转方向,生成 PDF/A 格式文件。 1330AI-PDFGitHub/AI开源
React-Tetris一个用 React 框架开发的经典俄罗斯方块游戏。它用了组件化设计,能键盘控制,也能适配不同屏幕,既可以嵌入 React 应用,也能当独立组件用。 1170GitHub/AI开源
ValueCell AI全球首个开源金融智能体平台,采用社区驱动和多智能体模式,ValueCell提供选股、分析、新闻推送、市场研究、数据收集、情绪分析、策略生成等功能。 1540GitHub/AI开源
Archon一个能让AI 自动生成和优化其他AI代理的开源工具。作为首款 “Agenteer”,Archon 第六版支持多种工具库和 MCP 服务器集成,让生成的AI更高效可靠。 1240AI编程GitHub/AI开源
StreamMultiDiffusion一种基于区域语义控制的实时交互生成图像方法,主要用于图像生成和编辑应用。它基于扩散模型在文本到图像合成中的成功,旨在通过减少推理时间和提高生成图像的质量来提高扩散模型的可用性。 1420GitHub/AI开源
IndexTTSB站基于XTTS和Tortoise开发的文本转语音模型,具备工业级零样本TTS能力。针对中文场景创新采用字符-拼音混合建模,可快速修正发音错误。 1720GitHub/AI开源文字&语音
VideoSrtVideoSrt是一个可以识别视频语音自动生成字幕 SRT文件的开源软件工具。适用于快速、批量的为媒体(视频/音频)生成中/英文字幕、文本文件的业务场景。 1630GitHub/AI开源
Klic StudioKrillin AI推出的视频翻译和配音工具,它支持100多种语言的翻译和配音,有AI同步口型、自然声音克隆功能,还能把音频/视频转成文字。 1680AI翻译GitHub/AI开源
XHS-Downloader小红书链接提取/作品采集工具:提取账号发布、收藏、点赞作品链接;提取搜索结果作品链接、用户链接;采集小红书作品信息;提取小红书作品下载地址;下载小红书无水印作品文件! 1950GitHub/AI开源
DreamTalk一个由清华大学、阿里巴巴和华中科大共同开发的一个基于扩散模型可以让人物照片说话,支持包括歌曲、多种语言的语音、嘈杂的音频在内的各种声音匹配让人物头像说话的框架。 1190GitHub/AI开源
Open WebUI一个可扩展、功能丰富且用户友好的自托管 WebUI,适用于各种 LLM 运行器,支持的 LLM 运行器包括 Ollama 和 OpenAI 兼容的 API。 1160GitHub/AI开源
PDF补丁丁|PDFPatcherPDFPatcher,是国内开发者wmjordan用.NET框架开发的PDF工具,能帮咱们处理日常办公、学习和整理文档时遇到的PDF问题。 1250AI-PDFGitHub/AI开源
WeChat Bot基于WeChaty结合OpenAI ChatGPT、Kimi、讯飞等多种AI服务实现的开源微信机器人项目,用于自动回复微信消息或管理微信群/好友。 1700GitHub/AI开源自媒体
SuperTinyIcons一个收集了丰富 Logo的SVG 图标库,目前已收集386+ 个主流的品牌和产品的 Logo,包括GitHub、Twitter、Facebook等。适合用于网页设计、移动应用开发。 1230GitHub/AI开源插画/SVG
YouDub-Webui一款开源的多语言AI配音和视频翻译工具,优质视频中文化工具,YouDub-webui提供了一套完整的视频中文化工具包,涵盖了从视频下载、语音识别、字幕翻译、AI声音克隆、视频处理、自动上传等一系列流程。 1690GitHub/AI开源