返回上一页  首页 | cnbeta报时: 22:23:03
[图]Google Cloud的文本转语音/语音转文本API获重大更新
发布日期:2018-08-29 08:24:27  稿源:cnBeta.COM

Google Cloud的文本转语音(Text-to-Speech)和语音转文字(Speech-to-Text)两个API在今天获得的重磅更新中,引入了对更多语言的支持,会更容易从不同扬声器上听取自动生成的声音,并承诺为语音识别提供改进版工具来提供更好转换效果。在本轮更新中,Cloud Text-to-Speech API也正式向用户开放。

对于很多开发者来说,本轮更新最为重要的就是发布了17种基于WaveNet的新语音。WaveNet是Google利用机器学习来创建文本转语音音频文件的技术。在升级之后能够带来更自然的声音体验。在本轮更新中,文本转语音API中新增了14种语言和相关变体,提供了总计30种标准语音和26种WaveNet语音。

在语音转文本方面,Google让开发者更方便的转录多个扬声器上的样本。使用机器学习,这项服务能够识别多个不同扬声器上的语音(不过之前依然需要告知机器会有多少个扬声器样本),然后对扬声器进行编号。同样新版中支持多种语言,开发者最多能够选择四种语言,语音转文本API会自动识别当前设备使用哪种语言。

查看网友评论   返回完整版观看

返回上一页  首页 | cnbeta报时: 22:23:03

文字版  标准版  电脑端

© 2003-2024