TangoFlux

260 00

新加坡科技设计大学（SUTD）与NVIDIA合作研发的一款先进的文本到音频（TTA）生成模型，该模型拥有约5.15亿参数，能够在单个A40 G

TangoFlux

TangoFlux是新加坡科技设计大学（SUTD）与NVIDIA合作研发的一款先进的文本到音频（TTA）生成模型，该模型拥有约5.15亿参数，能够在单个A40 GPU上仅用3.7秒生成长达30秒的44.1kHz立体声音频。TangoFlux不仅可以生成音效如鸟叫、口哨、爆炸等声音，还能生成音乐。