字节跳动发布端到端同声传译模型

  • 2025-07-28 05:19:30
  • 731

据介绍,SeedLiveInterpret2.0是首个延迟&准确率接近人类水平的产品级中英语音同传系统,可实现极低的语音延迟水平。

官方称,它基于全双工端到端语音生成理解框架,支持中英互译,可实时处理多人语音输入,像人类同传译员一样以极低的延迟“边听边说”,一边接收源语言语音输入,一边直接输出目标语言的翻译语音。同时,SeedLiveInterpret2.0还支持0样本声音复刻。