Moshi

2个月前发布 75 00

一个多流实时语音生成 Transformer 模型,支持全双工语音对话,同时语音输入和输出,以及处理复杂对话场景的能力,包括重叠语音、中断和情绪表达等非语言信息。

所在地:
新加坡
收录时间:
2025-10-31