易魔声EmotiVoice易魔声EmotiVoice是一个强大的开源TTS引擎,支持中英文双语,包含2000多种不同的音色,以及特色的情感合成功能,支持合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音。 700GitHub/AI开源
ExplorerTabUtility一款 Windows 11 资源管理器多标签扩展工具,它能把新窗口都改成标签页,还带快捷键操作,文件资源管理器用起来就像浏览器一样方便,标签页也能搜、能批量管。 780GitHub/AI开源自媒体# 标签页管理
Diffuse to Choose一种基于扩散的图像修复模型,主要用于虚拟试穿场景。它能够在修复图像时保留参考物品的细节,适用于在线购物等虚拟试穿场景中的图像修复任务。 800GitHub/AI开源# Diffuse to Choose# diffusion# virtual try-all
Atomic Agents一个适用于构建模块化、可扩展的AI代理开源框架,它将复杂的AI系统分解为最小的、不可分割的组件,并通过这些组件的灵活组合来构建强大的 AI 应用。 840GitHub/AI开源智能体
LLM Engineer Toolkit一个精心整理的LLM 工具库,它将120多个与LLM相关的库按照功能和用途进行了细致分类,涵盖了从训练微调、应用开发、推理服务到安全评估等 LLM 开发全流程所需的工具。 750GitHub/AI开源
Linly-Dubbing一款开源的多语言AI配音和视频翻译工具。Linly-Dubbing可以自动将视频翻译成其他语言并生成字幕、克隆视频中说话者的声音并自动配音、进行口型同步。 810GitHub/AI开源
Notebook Copilot有了 Notebook CoPilot,开发笔记本的过程变得更加容易。这个简单的工具可以毫不费力地根据您的输入生成代码和 Markdown 单元格,从而显着简化您的工作流程。 570GitHub/AI开源
PDF补丁丁|PDFPatcherPDFPatcher,是国内开发者wmjordan用.NET框架开发的PDF工具,能帮咱们处理日常办公、学习和整理文档时遇到的PDF问题。 580AI-PDFGitHub/AI开源
AIdeaAIdea 是一款支持 GPT 以及国产大语言模型通义千问、文心一言等,支持 Stable Diffusion 文生图、图生图、 SDXL1.0、超分辨率、图片上色的全能型完全开源APP。 640GitHub/AI开源
Whisper语音识别模型Whisper 是一种通用的语音识别模型。它在不同音频的大型数据集上进行训练,也是一个多任务模型,可以执行多语言语音识别以及语音翻译和语言识别。 750AI大模型GitHub/AI开源
RTranslator一款开源、免费、离线的 Android 实时翻译应用程序。连接到拥有该应用程序的人,连接蓝牙耳机,将手机放入口袋中,然后您就可以像对方说您的语言一样进行对话。最佳智能手机 880GitHub/AI开源
Deepfakes CreatorDeepfakes Creator,可以通过文本输入生成逼真的会说话的真人视频。用户只需要上传想要化身模仿的人的照片,并写一个剧本,工具就能创建出逼真的人物化身视频,模拟人物说话。 570GitHub/AI开源
Motia一个专为开发者设计的AI代理框架,帮助开发者快速搭建、测试和部署生产级的 AI 代理。它强调代码优先和事件驱动,支持多语言开发,并提供可视化界面,使开发者能够专注于业务逻辑。 950AI编程GitHub/AI开源
FreeAskInternetFreeAskInternet 是一个完全免费、私有且本地运行的搜索聚合器,并使用 LLM 生成答案,无需 GPU。用户可以提出问题,系统将使用searxng进 740GitHub/AI开源
Jan.aiChatGPT 的开源、托管替代品,jan.ai可在您的计算机上100%离线运行。 980GitHub/AI开源# architecture# conversational AI# Customizable Intelligence
PDFMathTranslate一款开源的PDF文档翻译工具,专为翻译科技论文等PDF文件而设计。PDFMathTranslate能够完整保留原文的排版,包括公式和图表,并支持双语对照,保持原有目录结构。 840AI-PDFGitHub/AI开源
HandRefiner解决AI图像生成中手部畸形的问题 目前的图像生成模型,再生成图像方面已经非常出色,但在生成人类手部的图像时却常常出现问题,比如手指数量不对或者手形怪异。 610GitHub/AI开源
FireRedASR小红书FireRed 团队发布并开源的基于大模型的语音识别模型,它在中文普通话语音识别领域取得了新的SOTA,FireRedASR支持方言、英语及歌词识别。 710GitHub/AI开源
Awesome GPT-4o Images一个精选的GPT-4o生成图片集锦,收集了OpenAI 最新多模态模型 GPT‑4o 生成的精彩案例,展示其强大的文本‑图像理解与创作能力。 630GitHub/AI开源
ClotheDreamer一个虚拟试穿项目,可以从文本生成可穿戴3D 服装,ClotheDreamer是上海大学、上海交通大学、复旦大学和腾讯优图实验室出的。最佳服饰零售商 680GitHub/AI开源# CG# Computer Vision# Shanghai Film Academy
Platon.AI – 柏拉图智能Platon.AI柏拉图智能不仅仅是 AI 爬虫,也是 AI agents 的基础设施。 AI agents 要使用工具,就必须高速阅读理解在线网页,理解网页上的每一个元素——这就是 platon.AI 的技术。 700GitHub/AI开源
LiveSketchLiveSketch是一款AI生成视频工具,用户通过文本提示将静态素描转化为动画,它提供了一种简单直观的方法,使他们的素描变得生动活泼。 730GitHub/AI开源# animation# sketch# Text-to-Video
Droidrun一款可以通过AI代理实现Android设备的自动化操作开源框架,它结合视觉解析与UI结构提取技术,支持多种语言模型,可自动执行任务、处理复杂界面和动态UI。最佳智能手机 790GitHub/AI开源工作流/RPA
Memento一款基于mpv构建的开源视频播放器,专为学习日语设计。它巧妙地将视频播放与语言学习功能结合,支持通过影视内容进行语法分析、生词捕捉和记忆卡片制作。 680GitHub/AI开源自媒体# 日语视频播放器