超越TTS：谷歌WaveNet人工智能可以讲得比真人还生动 - cnBeta.COM 移动版(WAP)

返回上一页首页 | cnbeta报时: 18:14:47

超越TTS：谷歌WaveNet人工智能可以讲得比真人还生动

发布日期:2016-09-13 14:30:33 稿源：cnBeta.COM

Google已经将人工智能技术运用到了图像搜索和机器人对话等领域，甚至在围棋比赛上战翻了世界顶尖棋手。现在，该公司又将AI技术运用到了如何逼真地模仿人类语声上，包括用嘴和呼吸系统发出的“非演说”声音（non-speech sounds）。这套系统被叫做WaveNet，该神经网络可以生成语音波形元数据，并且惊人般地生动。

WaveNet compared to concatenative and parametric TTS.jpg

虽然我们早就有了非常实用的TTS（文本语音转换）系统，盲人等因此而颇为受益。但其通常先是录制一个人说各种各样的声音，然后生硬地衔接到一起（concatenative TTS）。

“参数式”文本语音转换（parametric TTS）则可通过语音编码器、合成分析和再现语音输入，但听起来还是太像机器（不够自然）。

相比之下，真人在说话的时候，会有很多更加零碎的声音/语气相助，而WaveNet则是一个可以更好地学习模仿真人说话的AI。

WaveNet能够对原始声波模式进行建模，每秒分析16000个样本，然后生成一个基于之前声音的预测模型，结果就是惊人的高仿真度——换言之，WaveNet已经能够“发出自己的声音”。

有关这项研究的更多内容，请移步至DeeMind博客（传送门）。

[编译自：Cnet]

我们在FebBox(https://www.febbox.com/cnbeta) 开通了新的频道，更好阅读体验，更及时更新提醒，欢迎前来阅览和打赏。

查看网友评论返回完整版观看

最新资讯

加载中...

美国空军U-2侦察机以新的飞行纪录庆祝机型诞生70周年

GPT-5真“降智”了但重现“神之一手”剑指代码王座

特朗普向UCLA索要10亿美元和解金加州州长：不会向政治敲诈低头

全球最高安全标准国产“华龙一号”核电浙江金七门全面启动

马斯克自曝或失去对特斯拉的控制

网友盘点神级老头乐：玛莎老弟、绝望U8、阿斯顿马蛋让人笑喷

30秒单摇分别跳220次、232次中国选手打破跳绳世界纪录

ChatGPT 为何退回了 4o ？

马斯克“邪修”Grok 泰勒·斯威夫特叒成受害者

电动车补贴即将结束美国7月电车市占率创史上新高

波音：已收获20多家客户超260架737-800BCF订单和购买意向

今日最热

加载中...

ChatGPT-5上线遭“滑铁卢” OpenAI回归GPT-4o

Linus Torvalds拒绝Linux 6.17的RISC-V更改并称之为“垃圾”

员工涉嫌窃取2nm技术日本高管急赴台积电请罪被拒

阿里小号App下线搞崩了无数网友的心态

一公司总经理提议给自己发200万固定月薪

20核+128GB内存、3万元起步 NVIDIA超级CPU秋季量产

吴恩达解释为何Meta等公司能够为AI研究人员提供1亿美元薪酬

交警发理想车主违停照留言转发超10万李想称已知哪个品牌在黑理想

GPT-5发布后ChatGPT Plus用户权益被缩减引抗议萨姆奥特曼亲自道歉

摩托前高管自曝手机厂一年就倒闭美国人不爱打螺丝

Mozilla因Firefox AI“膨胀”导致CPU和电池耗尽而受到批评

返回上一页首页 | cnbeta报时: 18:14:47

文字版标准版电脑端

© 2003-2025