微软 AI 语音为视障人士制作并捐赠经典文学作品有声书
12 月 2 日,微软将首批由人工智能语音合成的有声内容捐赠给北京市红丹丹视障文化服务中心开发的“心目图书馆”小程序,即日起可免费获取收听。这些有声内容包括鲁迅、老舍、萧红、朱自清等作家的一系列经典作品。
这些内容基于 Azure 云认知服务语音合成平台 Speech Studio 及其人工智能语音制作,选用的音源包括由艺人周迅、红丹丹视障人士播音员董丽娜授权的定制声音,以及多个微软智能语音合成平台声音。应用最新技术后,最快能在几百毫秒内合成一本有声书,且能够 7*24 小时不间断生成。
周迅 AI 语音红丹丹公益项目发起人曾宇表示,微软尊重知识产权及保护信息安全,是值得信赖的合作伙伴。微软语音技术合成的 AI 声音非常自然、人性化、富有情感,最终呈现出来的周迅 AI 语音也具有说服力。
2014 年,微软与红丹丹合作在 Azure 上搭建了“心目图书馆”,帮助视障人士从移动设备随时收听有声读物。2019 年,微软利用神经网络语音合成技术打造了“晓晓”、“云野”等更自然的人工智能声音,以及能批量文字转语音的平台,降低了有声内容创作的成本。2020 年 4 月 23 日世界读书日,由微软主办,周迅与红丹丹联合发起的“让读书更有温度”活动举行。
该有声书制作工程是微软社会责任项目 AI for Good 其中的人工智能无障碍计划(AI for Accessibility)的一部分。该计划预计在 2018-2022 的五年内投入 2500 万美元,研发能够增强人类能力的人工智能技术,让全球残障人士更好地走进职场、融入现代生活、增进人际交往。
微软基于深度神经网络的文字转语音技术已在超过 50 个地区语言上发布,目前的语音模型几乎能够达到真人录音水平,并能够提供多角色、多情感、多风格,适用于丰富场景的平台原生或定制声音。