BongoCat一款轻量级、开源且跨平台的桌面猫咪宠物应用,由开发者ayoungweb 制作,它通过可爱的猫咪形象与用户互动,能根据键盘敲击和鼠标操作做出反应。交互式宠物 3940GitHub/AI开源
ResumeToJob一个免费开源的在线简历生成器,用户可以实时编辑简历并一键导出 PDF 文件,数据会保存在本地浏览器,并有多种好看的简历模板,手机和 电脑都能用。 1530AI简历GitHub/AI开源# open-source
YouDub-Webui一款开源的多语言AI配音和视频翻译工具,优质视频中文化工具,YouDub-webui提供了一套完整的视频中文化工具包,涵盖了从视频下载、语音识别、字幕翻译、AI声音克隆、视频处理、自动上传等一系列流程。 1460GitHub/AI开源
Klic StudioKrillin AI推出的视频翻译和配音工具,它支持100多种语言的翻译和配音,有AI同步口型、自然声音克隆功能,还能把音频/视频转成文字。 1440AI翻译GitHub/AI开源
RTranslator一款开源、免费、离线的 Android 实时翻译应用程序。连接到拥有该应用程序的人,连接蓝牙耳机,将手机放入口袋中,然后您就可以像对方说您的语言一样进行对话。最佳智能手机 1390GitHub/AI开源
QuickRecorder一款基于ScreenCapture Kit for macOS的轻量级录屏 工具/基于 ScreenCapture Kit的多功能、轻量化、高性能的开源macOS屏幕录制工具。 1390GitHub/AI开源
GitHub · Change is constant. GitHub keeps you ahead. · GitHubJoin the world's most widely adopted, AI-powered developer platform where millions of developers, businesses, and the largest open source community build software that advances humanity.1380AI大模型GitHub/AI开源
IndexTTSB站基于XTTS和Tortoise开发的文本转语音模型,具备工业级零样本TTS能力。针对中文场景创新采用字符-拼音混合建模,可快速修正发音错误。 1360GitHub/AI开源文字&语音
ChopperBot一款能用于像虎牙、斗鱼、抖音、BiliBili、TikTok、Twitch 等平台的智能直播视频剪辑发布工具,能实现自动化视频剪辑和自动化切片操作,而且非常智能。 1360GitHub/AI开源工作流/RPA
Motia一个专为开发者设计的AI代理框架,帮助开发者快速搭建、测试和部署生产级的 AI 代理。它强调代码优先和事件驱动,支持多语言开发,并提供可视化界面,使开发者能够专注于业务逻辑。 1350AI编程GitHub/AI开源
GenAI_Agents一个专注于生成式AI Agents技术的开源项目,GenAI_Agents提供从基础到高级的教程与实现代码,帮助开发者学习并构建智能、交互式的AI系统。 1340GitHub/AI开源
Eigent AI全球首个桌面端多智能体生产力平台,采用多智能体协作架构,通过拆分任务、并行处理来提高复杂任务的执行效率,支持本地部署和云端运行,还有人类参与机制,能保证结果准确可靠。 1340GitHub/AI开源MCP
PDF-Guru一个通用型PDF文件处理工具,PDF-Guru包含PDF合并、拆分、旋转、水印、加密、转换等20多项常用功能,完全开源,个人免费使用,界面简洁,简单易用。 1330GitHub/AI开源
XHS-Downloader小红书链接提取/作品采集工具:提取账号发布、收藏、点赞作品链接;提取搜索结果作品链接、用户链接;采集小红书作品信息;提取小红书作品下载地址;下载小红书无水印作品文件! 1320GitHub/AI开源
ValueCell AI全球首个开源金融智能体平台,采用社区驱动和多智能体模式,ValueCell提供选股、分析、新闻推送、市场研究、数据收集、情绪分析、策略生成等功能。 1320GitHub/AI开源
VideoSrtVideoSrt是一个可以识别视频语音自动生成字幕 SRT文件的开源软件工具。适用于快速、批量的为媒体(视频/音频)生成中/英文字幕、文本文件的业务场景。 1300GitHub/AI开源
PDFMathTranslate一款开源的PDF文档翻译工具,专为翻译科技论文等PDF文件而设计。PDFMathTranslate能够完整保留原文的排版,包括公式和图表,并支持双语对照,保持原有目录结构。 1290AI-PDFGitHub/AI开源
StreamMultiDiffusion一种基于区域语义控制的实时交互生成图像方法,主要用于图像生成和编辑应用。它基于扩散模型在文本到图像合成中的成功,旨在通过减少推理时间和提高生成图像的质量来提高扩散模型的可用性。 1280GitHub/AI开源
中国大模型列表大全中国大模型列表大全,全面收集有明确来源的大模型情况,包括机构、来源信息和分类等,随时更新。旨在记录中国大模型发展情况,欢迎在Issues中提供提供线索和素材。 1280GitHub/AI开源
Ncurator/馆长知识库AI问答助手,让AI帮助你整理与分析知识,馆长基于语义和关键词搜索技术,当你输入问题时,馆长智能分析你的查询,并从你的知识库中检索出最相关的信息。 1260GitHub/AI开源# AI# GPT
AI Comic FactoryAI Comic Factory是一个免费开源的AI漫画生成器,使用LLM + SDXL开发。它能够根据用户提供的提示词生成漫画,并支持无损放大、保存和打印。 1260GitHub/AI开源
LandPPT一个基于大语言模型的开源免费AIPPT生成平台,支持将文档内容自动转为专业PPT,具备多AI模型支持、智能文档处理、智能配图、深度研究等功能。 1250AI-PPTGitHub/AI开源# AI PPT# LLM
EZ-Work一款开源AI文档翻译助手,帮助用户使用 OpenAI 等大型语言模型API快速且经济高效地翻译文档。支持txt、word、csv、excel、pdf、ppt等多种文档格式的翻译,适用于各种需要文档翻译的场景。 1240GitHub/AI开源
Linly-Dubbing一款开源的多语言AI配音和视频翻译工具。Linly-Dubbing可以自动将视频翻译成其他语言并生成字幕、克隆视频中说话者的声音并自动配音、进行口型同步。 1240GitHub/AI开源
Dual AI Chat一个聊天应用,核心设计是让两个不同风格的人工智能通过辩论协作生成回答。默认接入 Google Gemini API,同时兼容其他 OpenAI 标准的 API 接口,也支持本地模型或其他托管服务。 1230AI大模型GitHub/AI开源
Midscene.js一款基于AI的自动化浏览器助手,能够通过自然语言操作网页。你只需描述要执行的任务,Midscene.js会自动处理网页,如发推文、验证内容、搜索信息等功能。 1220GitHub/AI开源工作流/RPA
Atomic Agents一个适用于构建模块化、可扩展的AI代理开源框架,它将复杂的AI系统分解为最小的、不可分割的组件,并通过这些组件的灵活组合来构建强大的 AI 应用。 1220GitHub/AI开源智能体
Whisper语音识别模型Whisper 是一种通用的语音识别模型。它在不同音频的大型数据集上进行训练,也是一个多任务模型,可以执行多语言语音识别以及语音翻译和语言识别。 1210AI大模型GitHub/AI开源
DeepSeek官方工具箱由 DeepSeek官方团队维护的开源项目,提供与 DeepSeek API 集成的各种工具和资源,应用程序、AI Agent 框架、RAG 框架、浏览器插件、VS Code 插件等。 1190GitHub/AI开源
FreeAskInternetFreeAskInternet 是一个完全免费、私有且本地运行的搜索聚合器,并使用 LLM 生成答案,无需 GPU。用户可以提出问题,系统将使用searxng进 1190GitHub/AI开源
卡卡字幕助手 | VideoCaptioner一款基于 LLM 的智能字幕助手,无需GPU一键高质量字幕视频合成!支持生成、断句、优化、翻译全流程。卡卡字幕助手让视频字幕制作简单高效!优化、翻译,字幕视频全流程一键处理! 1190GitHub/AI开源字幕# 字幕
NeuraPress/Markdown编辑器一款专注于微信公众号排版的Markdown编辑器,支持移动端,搭配DeepSeek和微信公众号助手,利用碎片化时间,通过手机就能编辑并发布带有排版效果的公众号文章。 1190GitHub/AI开源排版/分发
LiveSketchLiveSketch是一款AI生成视频工具,用户通过文本提示将静态素描转化为动画,它提供了一种简单直观的方法,使他们的素描变得生动活泼。 1180GitHub/AI开源# Text-to-Video
Coze on WeChat一个基于微信平台开发的智能助手,主要对接 Coze 平台,支持大部分 Coze Bot 功能。它允许用户通过微信与 AI 聊天机器人进行交互,支持文本、语音等多种交互方式。 1180GitHub/AI开源智能体
FUZZ由Riffusion推出的一款基于扩散模型(Diffusion Model)的全新音乐生成模型,该工具能够通过“想象”生成音频的声谱图(Spectrogram),然后将其转换为音频。便携式音箱 1170GitHub/AI开源
Awesome LLM Apps一个精选的LLM(大型语言模型)应用集合,汇集了使用OpenAI、Anthropic、Google、Gemini以及开源模型(如DeepSeek、Qwen或Llama)构建的LLM应用。 1160GitHub/AI开源
MagicColor香港科技大学团开发的首个支持单次前向传播多实例集成的线稿上色框架,用户仅需上传一张黑白线稿和若干参考图像,系统便能在数秒内自动完成精准且自然的色彩填充。 1160GitHub/AI开源文/图生图
Droidrun一款可以通过AI代理实现Android设备的自动化操作开源框架,它结合视觉解析与UI结构提取技术,支持多种语言模型,可自动执行任务、处理复杂界面和动态UI。最佳智能手机 1160GitHub/AI开源工作流/RPA
ExplorerTabUtility一款 Windows 11 资源管理器多标签扩展工具,它能把新窗口都改成标签页,还带快捷键操作,文件资源管理器用起来就像浏览器一样方便,标签页也能搜、能批量管。 1160GitHub/AI开源自媒体
WeChat Bot基于WeChaty结合OpenAI ChatGPT、Kimi、讯飞等多种AI服务实现的开源微信机器人项目,用于自动回复微信消息或管理微信群/好友。 1150GitHub/AI开源自媒体
LLM Engineer Toolkit一个精心整理的LLM 工具库,它将120多个与LLM相关的库按照功能和用途进行了细致分类,涵盖了从训练微调、应用开发、推理服务到安全评估等 LLM 开发全流程所需的工具。 1140GitHub/AI开源
FireRedASR小红书FireRed 团队发布并开源的基于大模型的语音识别模型,它在中文普通话语音识别领域取得了新的SOTA,FireRedASR支持方言、英语及歌词识别。 1140GitHub/AI开源
PiliPala一款基于Flutter开发的B站开源第三方客户端。支持Android和iOS平台,提供无广告的高清视频播放体验,具备倍速播放、离线缓存、稍后再看等功能。 1140GitHub/AI开源自媒体
Maxun.dev一个无代码网页数据提取平台,可以可靠、大规模地从网站提取和自动化数据,能将任何网站转为实时数据馈送,Maxun.dev使用简便,不用编码,几分钟就可以上手。 1140GitHub/AI开源工作流/RPA
易魔声EmotiVoice易魔声EmotiVoice是一个强大的开源TTS引擎,支持中英文双语,包含2000多种不同的音色,以及特色的情感合成功能,支持合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音。 1120GitHub/AI开源
Cherry Studio官网一款开源的支持多种大型语言模型(LLM)桌面AI客户端,集成了多个LLM,支持Ollama本地模型部署。 1120AI大模型GitHub/AI开源# GPT# LLM# 人工智能
SwiftChat一款基于React Native开发的快速、安全、跨平台聊天应用,支持实时流式聊天功能和Markdown语法,还可以生成AI图像,兼容DeepSeek、Amazon Bedrock、Ollama和OpenAI等模型。 1120GitHub/AI开源