AI工具软件

共 5036 篇网址

Comflowy

Comflowy社区开箱即用的 Comfy UI 整合包一键安装，小白也能轻松上手。

970

AI大模型 # comflowy # comfy # ComfyUI

Animagine XL 3.1

Animagine XL 3.1

一个开源的文本生成图像动漫模型，通过整合新的数据集，Animagine XL 3.1扩展了对广泛动漫作品和风格的理解，从经典作品到最新发布的动漫，覆盖了从古老到现代的各种艺术风格。

720

GitHub/AI开源

迅排设计

一款漂亮且功能强大的在线海报设计器，图片编辑器，仿稿定设计，迅排设计 Poster-Design适用于海报生成、电商产品图、文章长图、视频/公众号封面等多种场景。

680

自媒体设计

StreamMultiDiffusion

StreamMultiDiffusion

一种基于区域语义控制的实时交互生成图像方法，主要用于图像生成和编辑应用。它基于扩散模型在文本到图像合成中的成功，旨在通过减少推理时间和提高生成图像的质量来提高扩散模型的可用性。

760

GitHub/AI开源

AniPortrait

一款由腾讯研究人员开发的音频驱动的肖像动画合成框架，AniPortrait能够根据音频和静态人脸图片生成逼真的动态视频。

620

GitHub/AI开源

InstantMesh

一个基于单张图片，利用先进的稀疏视图大型重建模型（LRM）架构，快速生成3D网格（Mesh）的工具

670

GitHub/AI开源

微软VASA-1

微软亚洲研究院开发的一种前沿人工智能技术，VASA-1能够将单一静态图像和一段语音音频转换成逼真的对话面部动画。

780

IDM-VTON

一种先进的虚拟试穿技术，它通过结合视觉编码器和UNet模型来生成高质量的虚拟试穿图像，并且可以通过定制来进一步提高图像的一致性和真实性。

630

GitHub/AI开源

HiDiffusion

大幅提升扩散模型的图像生成质速度提升6倍，由字节跳动的研究团队开发，只需添加一行代码即可

640

GitHub/AI开源

Perplexica

一个提供高质量搜索体验的开源AI驱动搜索引擎，Perplexica通过理解用户问题并利用机器学习算法来提供精准的搜索结果。

680

GitHub/AI开源

XHS-Downloader

小红书链接提取/作品采集工具：提取账号发布、收藏、点赞作品链接；提取搜索结果作品链接、用户链接；采集小红书作品信息；提取小红书作品下载地址；下载小红书无水印作品文件！

730

GitHub/AI开源

StoryDiffusion

一款由南开大学HVision团队开发的人工智能工具，主要功能包括生成连贯的图像和视频故事，以及漫画生成创作。

670

GitHub/AI开源

Stirling-PDF

一个基于Web强大的开源PDF操作工具。它使您能够对 PDF 文件执行各种操作，包括拆分、合并、转换、重组、添加图像、旋转、压缩等。

770

AI-PDF GitHub/AI开源

RTranslator

一款开源、免费、离线的 Android 实时翻译应用程序。连接到拥有该应用程序的人，连接蓝牙耳机，将手机放入口袋中，然后您就可以像对方说您的语言一样进行对话。最佳智能手机

880

GitHub/AI开源

Diffutoon

一项突破性的卡通着色进步，植根于扩散模型，通过解决四个子问题：风格化、一致性增强、结构指导和着色，将逼真的视频转变为动漫风格。

830

GitHub/AI开源

Omnivore

一款免费、开源、适合认真阅读的稍后阅读应用程序。不受干扰。注重隐私。开源。专为知识工作者和终身学习者而设计。

690

GitHub/AI开源

Streamer-Sales销冠

Streamer-Sales销冠

销冠，卖货主播 LLM 大模型，Streamer-Sales就一款能够根据给定的商品特点从激发用户购买意愿角度出发进行商品解说的卖货主播大模型。

690

GitHub/AI开源

DUIX

硅基智能打造的AI数字人智能交互平台。通过将数字人交互能力开源，开发者可自行接入多方大模型、语音识别（ASR）、语音合成（TTS）能力，实现数字人实时交互。

760

GitHub/AI开源

Wiseflow

一款敏捷的信息挖掘开源免费工具，Wiseflow可以从网站、微信公众号、社交平台等各种信息源中按设定的关注点提炼讯息，自动做标签归类并上传数据库。

890

GitHub/AI开源

Meilisearch

闪电般快速的搜索 API，可轻松融入您的应用程序、网站和工作流程

750

AutoStudio

在多轮交互式图像生成中制作一致的主题

930

GitHub/AI开源

Farfalle

一个开源的AI 驱动的答案搜索引擎，定位为 Perplexity 的自托管替代品。

810

AI大模型海外AI

ClotheDreamer

一个虚拟试穿项目，可以从文本生成可穿戴3D 服装，ClotheDreamer是上海大学、上海交通大学、复旦大学和腾讯优图实验室出的。最佳服饰零售商

690

GitHub/AI开源 # CG # Computer Vision # Shanghai Film Academy

MimicMotion

腾讯和上交大出的，具有置信度感知姿势指导的高质量人体运动视频生成，MimicMotion可以生成任意长度、具有任何动作指导的高质量视频生成框架。

930

GitHub/AI开源

FreeAskInternet

FreeAskInternet

FreeAskInternet 是一个完全免费、私有且本地运行的搜索聚合器，并使用 LLM 生成答案，无需 GPU。用户可以提出问题，系统将使用searxng进

760

GitHub/AI开源

QuickRecorder

一款基于ScreenCapture Kit for macOS的轻量级录屏工具/基于 ScreenCapture Kit的多功能、轻量化、高性能的开源macOS屏幕录制工具。

850

GitHub/AI开源

LivePortrait

利用AI技术将静态照片转换为视频，展现逼真的面部表情和动作。

650

GitHub/AI开源

EchoMimic

一个基于音频驱动的肖像动画生成工具，通过可编辑的特征点条件生成逼真、自然的动画，用户可以根据自己的需求调整动画细节。

650

GitHub/AI开源

Unique3D

一种图像到3D框架，可以从单视图图像高效生成高质量的3D网格。具有最先进的生成保真度和强大的通用性。

620

GitHub/AI开源

UniVG

百度公司推出的视频生成模型，能够以文本和图像的任意组合作为输入条件进行视频生成。

670

MemFree

一个开源混合AI搜索引擎，借助 MemFree，您可以立即从互联网、书签、笔记和文档中获得准确的答案。

740

Teable

一个基于 Postgres 构建的超快速、实时、专业、开发人员友好的无代码数据库。Teable使用简单的、类似电子表格的界面来创建复杂的企业级数据库应用程序，无需编写代码。

740

Emote Portrait Alive

Emote Portrait Alive

阿里巴巴发布的EMO，一种音频驱动的AI肖像视频生成框架。通过输入单一的参考图像和语音音频，Emote Portrait Alive可以生成动态的、表情丰富的肖像视频。

790

图/文生视频

VideoDoodles

一款能在视频中轻松任意插入手绘动画并与视频内容无缝融合的AI工具，通过VideoDoodles你可以在视频中添加手绘涂擦动画，这些动画不仅能跟随视频中的物体移动，还能自动调整大小和角度。

650

Kolors Virtual Try-On

Kolors Virtual Try-On

由快手可图团队开发的AI试衣技术，通过可图AI试衣，用户上传自已的照片，就可以在几秒钟内看到自己穿上不同衣服的效果。最佳服饰零售商

810

AI跨境电商设计

LinkedIn_AIHawk

LinkedIn_AIHawk

您的人工智能求职助手。自动化申请、LinkedIn_AIHawk让你获得个性化建议并更快地找到您梦想的工作。

670

GitHub/AI开源

TokenFlow

一个利用预训练的文本到图像扩散模型进行视频编辑的框架。它无需进一步训练或微调，即可实现一致的视频编辑效果。

660

GitHub/AI开源 # KEYWORDS SHOULD BE PLACED HERE

EZ-Work

一款开源AI文档翻译助手，帮助用户使用 OpenAI 等大型语言模型API快速且经济高效地翻译文档。支持txt、word、csv、excel、pdf、ppt等多种文档格式的翻译，适用于各种需要文档翻译的场景。

860

GitHub/AI开源

Linly-Dubbing

一款开源的多语言AI配音和视频翻译工具。Linly-Dubbing可以自动将视频翻译成其他语言并生成字幕、克隆视频中说话者的声音并自动配音、进行口型同步。

820

GitHub/AI开源

ChatTTS-Forge

一个围绕 TTS生成模型开发的项目，ChatTTS-Forge为用户提供灵活的TTS生成能力，支持多种音色、风格控制、长文本推理等功能。

630

GitHub/AI开源

libcom

上海交通大学牛力教授团队推出的一款图像合成工具箱，经过六年的研发，集成了多种强大的图像处理功能。

620

GitHub/AI开源

FacePoke

一个实时编辑脸部表情和头部位置的AI 工具。用户可以通过简单的拖放界面，轻松调整面部特征和表情，使静态的肖像变得生动。

660

GitHub/AI开源

ChatNio

一个集合了各种流行的模型和服务的一站式平台，提供包括 OpenAI、Midjourney、Claude、讯飞星火、Stable Diffusion、DALL·E 等一站式的解决方案

650

AI大模型 # ChatNio # CoAI

PDFMathTranslate

PDFMathTranslate

一款开源的PDF文档翻译工具，专为翻译科技论文等PDF文件而设计。PDFMathTranslate能够完整保留原文的排版，包括公式和图表，并支持双语对照，保持原有目录结构。

860

AI-PDF GitHub/AI开源

卡卡字幕助手 | VideoCaptioner

卡卡字幕助手 | VideoCaptioner

一款基于 LLM 的智能字幕助手，无需GPU一键高质量字幕视频合成！支持生成、断句、优化、翻译全流程。卡卡字幕助手让视频字幕制作简单高效！优化、翻译，字幕视频全流程一键处理！

750

GitHub/AI开源字幕 # 字幕

MinerU

一站式开源高质量数据提取工具，支持PDF、网页、多格式电子书提取，自动识别并转换LaTeX格式、HTML格式，自动OCR，支持多语言。

730

AI-PDF GitHub/AI开源

AnchorCrafter

一个由计算所、美团、腾讯等机构合作研发，专为电商场景设计，能够自动生成具有主播风格的AI虚拟主播带货视频神器。

670

视频编辑 # Hexo Theme Keep # 文生视频

HandyArrows手绘箭头

HandyArrows手绘箭头

一个提供手绘风格 SVG 箭头素材的网站，HandyArrows上所有素材均为免费开源，并可商用，适用于各种设计需求，如演示文稿、网页设计等。

740

VISION XL

一款专注于视频质量修复与增强的全新工具，VISION XL利用潜在扩散模型来解决高清视频的逆问题，能够在资源要求较低的环境下提供出色的修复与超分辨率能力。

760

GitHub/AI开源

LogoCreator

一款由开源达人Hassan打造的AI Logo设计工具，LogoCreator依托Together AI平台的Flux模型实现，为用户提供智能、高效的Logo生成功能。

640

GitHub/AI开源