卡卡字幕助手 | VideoCaptioner一款基于 LLM 的智能字幕助手,无需GPU一键高质量字幕视频合成!支持生成、断句、优化、翻译全流程。卡卡字幕助手让视频字幕制作简单高效!优化、翻译,字幕视频全流程一键处理! 740GitHub/AI开源字幕# 字幕
Build Your Own X一个帮助开发者提升编程能力的开源项目,Build Your Own X提供了丰富的教程和资源,用户通过从零开始重新实现各种技术(如Web服务器、数据库、操作系统等)。 660GitHub/AI开源
FUZZ由Riffusion推出的一款基于扩散模型(Diffusion Model)的全新音乐生成模型,该工具能够通过“想象”生成音频的声谱图(Spectrogram),然后将其转换为音频。便携式音箱 820GitHub/AI开源
MagicColor香港科技大学团开发的首个支持单次前向传播多实例集成的线稿上色框架,用户仅需上传一张黑白线稿和若干参考图像,系统便能在数秒内自动完成精准且自然的色彩填充。 760GitHub/AI开源文/图生图
SuperTinyIcons一个收集了丰富 Logo的SVG 图标库,目前已收集386+ 个主流的品牌和产品的 Logo,包括GitHub、Twitter、Facebook等。适合用于网页设计、移动应用开发。 620GitHub/AI开源插画/SVG
LiveSketchLiveSketch是一款AI生成视频工具,用户通过文本提示将静态素描转化为动画,它提供了一种简单直观的方法,使他们的素描变得生动活泼。 730GitHub/AI开源# animation# sketch# Text-to-Video
LLM Engineer Toolkit一个精心整理的LLM 工具库,它将120多个与LLM相关的库按照功能和用途进行了细致分类,涵盖了从训练微调、应用开发、推理服务到安全评估等 LLM 开发全流程所需的工具。 760GitHub/AI开源
PDF补丁丁|PDFPatcherPDFPatcher,是国内开发者wmjordan用.NET框架开发的PDF工具,能帮咱们处理日常办公、学习和整理文档时遇到的PDF问题。 590AI-PDFGitHub/AI开源
VISION XL一款专注于视频质量修复与增强的全新工具,VISION XL利用潜在扩散模型来解决高清视频的逆问题,能够在资源要求较低的环境下提供出色的修复与超分辨率能力。 750GitHub/AI开源
Midscene.js一款基于AI的自动化浏览器助手,能够通过自然语言操作网页。你只需描述要执行的任务,Midscene.js会自动处理网页,如发推文、验证内容、搜索信息等功能。 690GitHub/AI开源工作流/RPA
ClotheDreamer一个虚拟试穿项目,可以从文本生成可穿戴3D 服装,ClotheDreamer是上海大学、上海交通大学、复旦大学和腾讯优图实验室出的。最佳服饰零售商 680GitHub/AI开源# CG# Computer Vision# Shanghai Film Academy
RTranslator一款开源、免费、离线的 Android 实时翻译应用程序。连接到拥有该应用程序的人,连接蓝牙耳机,将手机放入口袋中,然后您就可以像对方说您的语言一样进行对话。最佳智能手机 880GitHub/AI开源
NeuraPress/Markdown编辑器一款专注于微信公众号排版的Markdown编辑器,支持移动端,搭配DeepSeek和微信公众号助手,利用碎片化时间,通过手机就能编辑并发布带有排版效果的公众号文章。 780GitHub/AI开源排版/分发# 排版
Motia一个专为开发者设计的AI代理框架,帮助开发者快速搭建、测试和部署生产级的 AI 代理。它强调代码优先和事件驱动,支持多语言开发,并提供可视化界面,使开发者能够专注于业务逻辑。 950AI编程GitHub/AI开源
Open WebUI一个可扩展、功能丰富且用户友好的自托管 WebUI,适用于各种 LLM 运行器,支持的 LLM 运行器包括 Ollama 和 OpenAI 兼容的 API。 620GitHub/AI开源
SuperClaudeSuperClaude 是一个为 Claude Code 量身打造的零门槛编程的上下文工程开源框架。它通过一系列专门设计的命令、认知角色和开发方法,可以大大增强Claude Code 的能力。 690AI编程GitHub/AI开源