返回上一页  首页 | cnbeta报时: 11:24:45
新系统能根据音频剪辑创建与演讲者对口型的视频
发布日期:2017-07-12 08:52:06  稿源:cnBeta.COM

此前已经有一家创业公司推出语音合成服务,通过对60秒语音文档的部分信息进行筛选采集,随后进行重组,最后可以变成任何人的声音。现在华盛顿大学的研究人员已经创建了一个将音频剪辑转换成与演讲者对口型的视频的系统。

lip-synced-videos-1.jpg

为了使这个系统工作,需要分析大约14个小时的现场演讲视频- 研究人员希望能够显着减少这个数字,也许减少至一个小时。随后他们利用神经网络进行改进。 当系统被提供包括演讲人员的“目标视频”(他们可以在其中谈论任何东西)时,连同他们的音频文件说出所需的单词,它将两者组合在一起。它可以通过放弃视频的原始音频,将其替换为所需的音频,并将计算机模拟版本的演讲者的口型加入到视频中。最终的结果是,人们听到他们说出所需要的话,而且看起来也是这样。

助理教授 Ira Kemelmacher-Shlizerman表示:“现实的音频-视频转换具有实际应用,例如会议的改进视频会议,以及能够通过从音频创建视觉来与虚拟现实中的历史人物进行对话等。这是一种有助于实现下一步措施的突破。”

查看网友评论   返回完整版观看

返回上一页  首页 | cnbeta报时: 11:24:45

文字版  标准版  电脑端

© 2003-2024