微软详解“Group Transcribe”应用:多人多语言会议实时高精度转录及翻译
3 月初,微软车库孵化了一款免费的实时转录和翻译应用 Group Transcribe,采用微软 Azure AI 语音技术,高准确度堪比专业速记和同声传译水平。微软 Azure AI 部门技术和产品负责人详细解读了该款应用的优势。
Group Transcribe 针对面对面对话和会议设计,实时将语音内容转录为文本,方便整理会议记录,以及让有听力障碍的人士参会;其翻译功能也能让使用多语言的参会者流畅地跨语言沟通。
微软全球技术院士兼微软 Azure AI 首席技术官黄学东表示:“微软通过 Project Denmark 率先对分布式和动态麦克风阵列进行了研究。在此基础上,Group Transcribe 可以满足真实、实时、交互式的移动场景,让人们可以无语言障碍沟通交流。”
目前市场上的同类产品大多使用单设备转录,即每位参会者需要对着同一部设备的麦克风讲话。这无法让会议记录准确区分发言人,而且不符合疫情防控中有关社交距离的要求。
Group Transcribe 运用多设备转录,可以根据会议中每部手机麦克风对发言者进行收音,与此同时辨识声音来自哪一位发言者。
微软认知服务首席产品经理 Pavan Li 介绍:“Group Transcribe 支持包括中文在内多达 80 多个国家和地区的语言,具有精确、高效的语音转录和翻译功能。可以帮助每位参会者在会议上更专注于交流,不需要在聆听会议时分散精力做笔记。”
Group Transcribe 支持的语言包括阿拉伯语、保加利亚语、加泰罗尼亚语、粤语、中文(简体)、中文(繁体)、克罗地亚语、捷克语、丹麦语、荷兰语、英语、爱沙尼亚语、芬兰语、法语、德语、希腊语、印地语、爱尔兰语、意大利语、日语、韩语、立陶宛语、拉脱维亚语、马耳他语、挪威语、波兰语、葡萄牙语、罗马尼亚语、俄语、西班牙语、斯洛伐克语、斯洛文尼亚语、瑞典语、泰语等。
Group Transcribe 也可以用于欣赏播客或视频时,将手机放在旁边,即可生成实时字幕。
不过目前 Group Transcribe 只适用于 iOS 系统,应该会在后期推出 Android 版本。中国区 App Store 也已同步上架。