4月9日,字节跳动推出原生全双工语音大模型Seeduplex,目前已全量上线豆包App。该模型基于“边听边说”的全新框架设计,相比上一代半双工端到端语音模型,实现了听与说同步的实时交互,在对话节奏、自然度和抗干扰能力上有所提升。

据官方介绍,Seeduplex通过模型架构创新与训练优化,攻克了高并发下的卡顿与稳定性等工程挑战。在精准抗干扰方面,模型具备持续“倾听”能力,能理解用户所处的声学环境,准确忽略背景噪音和无关对话。复杂场景下,误回复率和误打断率较半双工模型减少50%。在动态判停方面,模型联合语音和语义特征综合判断用户意图,面对用户思考犹豫时能耐心倾听,用户说完后快速响应,抢话比例较半双工模型下降40%,判停表现提升8%。
多维度评测显示,Seeduplex在对话流畅度和节奏感上均显著优于传统半双工方案及行业主流App的语音通话功能。该模型已在业界率先实现规模化落地,可为上亿用户提供连续高质量的实时语音交互体验。
