新加坡科技设计大学(SUTD)与NVIDIA合作研发的一款先进的文本到音频(TTA)生成模型,该模型拥有约5.15亿参数,能够在单个A40 G
TangoFlux是新加坡科技设计大学(SUTD)与NVIDIA合作研发的一款先进的文本到音频(TTA)生成模型,该模型拥有约5.15亿参数,能够在单个A40 GPU上仅用3.7秒生成长达30秒的44.1kHz立体声音频。TangoFlux不仅可以生成音效如鸟叫、口哨、爆炸等声音,还能生成音乐。
{{#message}}{{{message}}}{{/message}}{{^message}}提交失败。 服务器发回了 {{status_text}} 响应(代码:{{status_code}})。 请与此表单处理器的开发者联系, 以改进此消息。 了解详情{{/message}}
{{#message}}{{{message}}}{{/message}}{{^message}}系统显示您已成功提交。 即使服务器响应正常,系统也有可能不处理提交。 请与此表单处理器的开发者联系, 以改进此消息。 了解详情{{/message}}
正在提交…