GitHub/AI开源

共 201 篇网址

CodeName Goose

一款开源代码智能体Agent，Codename Goose不仅能自动生成代码，还能安装、执行、测试。

700

GitHub/AI开源智能体

Audio2Photoreal

Audio2Photoreal

从音频生成全身逼真的虚拟人物形象。它可以从多人对话中语音中生成与对话相对应的逼真面部表情、完整身体和手势动作。

670

GitHub/AI开源

易魔声EmotiVoice

易魔声EmotiVoice是一个强大的开源TTS引擎，支持中英文双语，包含2000多种不同的音色，以及特色的情感合成功能，支持合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音。

700

GitHub/AI开源

AI Companion App

AI Companion App

AI Companion App，一键创建和训练属于你的AI伴侣/女朋友。

650

GitHub/AI开源

ExplorerTabUtility

ExplorerTabUtility

一款 Windows 11 资源管理器多标签扩展工具，它能把新窗口都改成标签页，还带快捷键操作，文件资源管理器用起来就像浏览器一样方便，标签页也能搜、能批量管。

780

GitHub/AI开源自媒体 # 标签页管理

CustomNet

CustomNet旨在更好地将指定物品的图片融合到新生成的图片中，并确保原物品的样式和纹理细节得以还原。这项技术给SD商品图融合带来了一线生机。

660

GitHub/AI开源

ChatTTS-Forge

一个围绕 TTS生成模型开发的项目，ChatTTS-Forge为用户提供灵活的TTS生成能力，支持多种音色、风格控制、长文本推理等功能。

620

GitHub/AI开源

AgentUniverse

一个面向复杂业务场景设计的多智能体协作框架，它提供了快速易用的大模型智能体应用搭建能力，以及丰富的多智能体协同模式组件。

820

GitHub/AI开源智能体

VideoDrafter

一个高质量视频生成的开放式扩散模型，相比之前的生成视频模型，VideoDrafter最大的特点是能在主体不变的基础上，一次性生成多个场景的视频。

580

GitHub/AI开源

Diffuse to Choose

Diffuse to Choose

一种基于扩散的图像修复模型，主要用于虚拟试穿场景。它能够在修复图像时保留参考物品的细节，适用于在线购物等虚拟试穿场景中的图像修复任务。

800

GitHub/AI开源 # Diffuse to Choose # diffusion # virtual try-all

Atomic Agents

一个适用于构建模块化、可扩展的AI代理开源框架，它将复杂的AI系统分解为最小的、不可分割的组件，并通过这些组件的灵活组合来构建强大的 AI 应用。

840

GitHub/AI开源智能体

LLM Engineer Toolkit

LLM Engineer Toolkit

一个精心整理的LLM 工具库，它将120多个与LLM相关的库按照功能和用途进行了细致分类，涵盖了从训练微调、应用开发、推理服务到安全评估等 LLM 开发全流程所需的工具。

750

GitHub/AI开源

Linly-Dubbing

一款开源的多语言AI配音和视频翻译工具。Linly-Dubbing可以自动将视频翻译成其他语言并生成字幕、克隆视频中说话者的声音并自动配音、进行口型同步。

810

GitHub/AI开源

Klic Studio

Krillin AI推出的视频翻译和配音工具，它支持100多种语言的翻译和配音，有AI同步口型、自然声音克隆功能，还能把音频/视频转成文字。

910

AI翻译 GitHub/AI开源

Flowise

一款开源的低/无代码工具，只要用于可视化构建LLM工作流。它通过拖拽界面，让用户不需要编写的复杂代码就可以快速搭建 LLM 应用。

780

GitHub/AI开源工作流/RPA

Presenton

一个可以本地运行的开源AI PPT生成器，使用OpenAI、Gemini或Ollama等模型，确保数据隐私和控制。

670

AI-PPT GitHub/AI开源

AutoGen

微软开发的一个开源框架，用于构建和管理基于LLM的多代理系统。它允许用户创建多个Agent，这些代理可以通过对话协作完成复杂的任务。

730

GitHub/AI开源工作流/RPA

Notebook Copilot

Notebook Copilot

有了 Notebook CoPilot，开发笔记本的过程变得更加容易。这个简单的工具可以毫不费力地根据您的输入生成代码和 Markdown 单元格，从而显着简化您的工作流程。

570

GitHub/AI开源

Awesome Chinese LLM

Awesome Chinese LLM

整理了开源的中文大语言模型（LLM），主要关注规模较小、可私有化部署且训练成本较低的模型，目前已收录了100多个相关资源。

690

GitHub/AI开源

HiDiffusion

大幅提升扩散模型的图像生成质速度提升6倍，由字节跳动的研究团队开发，只需添加一行代码即可

640

GitHub/AI开源

PDF补丁丁|PDFPatcher

PDF补丁丁|PDFPatcher

PDFPatcher，是国内开发者wmjordan用.NET框架开发的PDF工具，能帮咱们处理日常办公、学习和整理文档时遇到的PDF问题。

580

AI-PDF GitHub/AI开源

MakeAnything

一个基于扩散变换器的序列生成模型，通过其强大的生成能力，生成一致性的序列图像。

690

GitHub/AI开源文/图生图

AIdea

AIdea 是一款支持 GPT 以及国产大语言模型通义千问、文心一言等，支持 Stable Diffusion 文生图、图生图、 SDXL1.0、超分辨率、图片上色的全能型完全开源APP。

640

GitHub/AI开源

Whisper语音识别模型

Whisper 是一种通用的语音识别模型。它在不同音频的大型数据集上进行训练，也是一个多任务模型，可以执行多语言语音识别以及语音翻译和语言识别。

750

AI大模型 GitHub/AI开源

DeepFaceLive

DeepFaceLive是一款基于人工智能的面部合成技术，它可以将一个人的面部表情和动作合成到另一个人的脸上，从而实现非常逼真的面部合成效果。

640

GitHub/AI开源

AstrBot

一个开源的多平台 LLM 聊天机器人及开发框架，支持多个消息平台的集成，如QQ、微信，AstrBot支持多种大型语言模型（LLM）的接入。

740

GitHub/AI开源工作流/RPA

RTranslator

一款开源、免费、离线的 Android 实时翻译应用程序。连接到拥有该应用程序的人，连接蓝牙耳机，将手机放入口袋中，然后您就可以像对方说您的语言一样进行对话。最佳智能手机

880

GitHub/AI开源

Deepfakes Creator

Deepfakes Creator

Deepfakes Creator，可以通过文本输入生成逼真的会说话的真人视频。用户只需要上传想要化身模仿的人的照片，并写一个剧本，工具就能创建出逼真的人物化身视频，模拟人物说话。

570

GitHub/AI开源

Motia

一个专为开发者设计的AI代理框架，帮助开发者快速搭建、测试和部署生产级的 AI 代理。它强调代码优先和事件驱动，支持多语言开发，并提供可视化界面，使开发者能够专注于业务逻辑。

950

AI编程 GitHub/AI开源

FreeAskInternet

FreeAskInternet

FreeAskInternet 是一个完全免费、私有且本地运行的搜索聚合器，并使用 LLM 生成答案，无需 GPU。用户可以提出问题，系统将使用searxng进

740

GitHub/AI开源

Jan.ai

ChatGPT 的开源、托管替代品，jan.ai可在您的计算机上100%离线运行。

980

GitHub/AI开源 # architecture # conversational AI # Customizable Intelligence

PDFMathTranslate

PDFMathTranslate

一款开源的PDF文档翻译工具，专为翻译科技论文等PDF文件而设计。PDFMathTranslate能够完整保留原文的排版，包括公式和图表，并支持双语对照，保持原有目录结构。

840

AI-PDF GitHub/AI开源

RMBG-2.0

BRIA AI开发的开源图像背景移除模型，RMBG-2.0基于创新的BiRefNet架构，能够在复杂环境和高细节图像中提供高精度的背景去除。

620

GitHub/AI开源

HandRefiner

解决AI图像生成中手部畸形的问题目前的图像生成模型，再生成图像方面已经非常出色，但在生成人类手部的图像时却常常出现问题，比如手指数量不对或者手形怪异。

610

GitHub/AI开源

FireRedASR

小红书FireRed 团队发布并开源的基于大模型的语音识别模型，它在中文普通话语音识别领域取得了新的SOTA，FireRedASR支持方言、英语及歌词识别。

710

GitHub/AI开源

Awesome GPT-4o Images

Awesome GPT-4o Images

一个精选的GPT-4o生成图片集锦，收集了OpenAI 最新多模态模型 GPT‑4o 生成的精彩案例，展示其强大的文本‑图像理解与创作能力。

630

GitHub/AI开源

LinkedIn_AIHawk

LinkedIn_AIHawk

您的人工智能求职助手。自动化申请、LinkedIn_AIHawk让你获得个性化建议并更快地找到您梦想的工作。

660

GitHub/AI开源

ClotheDreamer

一个虚拟试穿项目，可以从文本生成可穿戴3D 服装，ClotheDreamer是上海大学、上海交通大学、复旦大学和腾讯优图实验室出的。最佳服饰零售商

680

GitHub/AI开源 # CG # Computer Vision # Shanghai Film Academy

Documate

Documate是一款针对站内文档问答的开源 AI 工具，旨在将 AI 聊天对话框无缝嵌入到您的网站之中。

690

GitHub/AI开源

Platon.AI – 柏拉图智能

Platon.AI – 柏拉图智能

Platon.AI柏拉图智能不仅仅是 AI 爬虫，也是 AI agents 的基础设施。 AI agents 要使用工具，就必须高速阅读理解在线网页，理解网页上的每一个元素——这就是 platon.AI 的技术。

700

GitHub/AI开源

PPTist

一款可以完全在浏览器中运行的在线PPT工具，支持在浏览器中编辑和展示 PPT和通过AI生成PPT。它还原了大部分PowerPoint 常用功能。

2.5K0

GitHub/AI开源

LiveSketch

LiveSketch是一款AI生成视频工具，用户通过文本提示将静态素描转化为动画，它提供了一种简单直观的方法，使他们的素描变得生动活泼。

730

GitHub/AI开源 # animation # sketch # Text-to-Video

AniPortrait

一款由腾讯研究人员开发的音频驱动的肖像动画合成框架，AniPortrait能够根据音频和静态人脸图片生成逼真的动态视频。

620

GitHub/AI开源

Droidrun

一款可以通过AI代理实现Android设备的自动化操作开源框架，它结合视觉解析与UI结构提取技术，支持多种语言模型，可自动执行任务、处理复杂界面和动态UI。最佳智能手机

790

GitHub/AI开源工作流/RPA

Memento

一款基于mpv构建的开源视频播放器，专为学习日语设计。它巧妙地将视频播放与语言学习功能结合，支持通过影视内容进行语法分析、生词捕捉和记忆卡片制作。

680

GitHub/AI开源自媒体 # 日语视频播放器

VideoSrt

VideoSrt是一个可以识别视频语音自动生成字幕 SRT文件的开源软件工具。适用于快速、批量的为媒体（视频/音频）生成中/英文字幕、文本文件的业务场景。

770

GitHub/AI开源

APISR

一个专注于动漫图像超分辨率的项目，旨在恢复和增强来自现实世界场景的低质量、低分辨率动漫图像和视频源。

740

GitHub/AI开源

Sora.FM

一个使用nextjs创建的用于生成 Sora AI视频的开源Web模板。

640

GitHub/AI开源

React-Tetris

一个用 React 框架开发的经典俄罗斯方块游戏。它用了组件化设计，能键盘控制，也能适配不同屏幕，既可以嵌入 React 应用，也能当独立组件用。

680

GitHub/AI开源

MinerU

一站式开源高质量数据提取工具，支持PDF、网页、多格式电子书提取，自动识别并转换LaTeX格式、HTML格式，自动OCR，支持多语言。

720

AI-PDF GitHub/AI开源