微软详解“Group Transcribe”应用:多人多语言会议实时高精度转录及翻译

摘要:

3 月初,微软车库孵化了一款免费的实时转录和翻译应用 Group Transcribe,采用微软 Azure AI 语音技术,高准确度堪比专业速记和同声传译水平。微软 Azure AI 部门技术和产品负责人详细解读了该款应用的优势。

image.png

Group Transcribe 针对面对面对话和会议设计,实时将语音内容转录为文本,方便整理会议记录,以及让有听力障碍的人士参会;其翻译功能也能让使用多语言的参会者流畅地跨语言沟通。

微软全球技术院士兼微软 Azure AI 首席技术官黄学东表示:“微软通过 Project Denmark 率先对分布式和动态麦克风阵列进行了研究。在此基础上,Group Transcribe 可以满足真实、实时、交互式的移动场景,让人们可以无语言障碍沟通交流。”

目前市场上的同类产品大多使用单设备转录,即每位参会者需要对着同一部设备的麦克风讲话。这无法让会议记录准确区分发言人,而且不符合疫情防控中有关社交距离的要求。

Group Transcribe 运用多设备转录,可以根据会议中每部手机麦克风对发言者进行收音,与此同时辨识声音来自哪一位发言者。

image.png

微软认知服务首席产品经理 Pavan Li 介绍:“Group Transcribe 支持包括中文在内多达 80 多个国家和地区的语言,具有精确、高效的语音转录和翻译功能。可以帮助每位参会者在会议上更专注于交流,不需要在聆听会议时分散精力做笔记。”

Group Transcribe 支持的语言包括阿拉伯语、保加利亚语、加泰罗尼亚语、粤语、中文(简体)、中文(繁体)、克罗地亚语、捷克语、丹麦语、荷兰语、英语、爱沙尼亚语、芬兰语、法语、德语、希腊语、印地语、爱尔兰语、意大利语、日语、韩语、立陶宛语、拉脱维亚语、马耳他语、挪威语、波兰语、葡萄牙语、罗马尼亚语、俄语、西班牙语、斯洛伐克语、斯洛文尼亚语、瑞典语、泰语等。

Group Transcribe 也可以用于欣赏播客或视频时,将手机放在旁边,即可生成实时字幕。

不过目前 Group Transcribe 只适用于 iOS 系统,应该会在后期推出 Android 版本。中国区 App Store 也已同步上架

相关文章:

微软车库项目Ink to Code上线:简化将应用UI草图转换为代码过程

[图]微软车库项目Road Runner:更精准培训AI算法

[图]微软车库应用Spend上架App Store 帮你轻松追踪消费

微软车库绘图应用Sketch 360上线:降低3D创作门槛

微软车库发布3D Maps SDK 展示Outings混合现实应用

[图]微软车库应用Read My World上线:日常使用中提高识字率

微软车库发布Windows 10应用Journal 适合习惯用数码笔写字的玩家

微软车库孵化Group Transcribe应用:帮与会者精准高效转录

我们在FebBox(https://www.febbox.com/cnbeta) 开通了新的频道,更好阅读体验,更及时更新提醒,欢迎前来阅览和打赏。
查看评论
created by ceallan