新系统能根据音频剪辑创建与演讲者对口型的视频 - cnBeta.COM 移动版(WAP)

返回上一页首页 | cnbeta报时: 21:26:01

新系统能根据音频剪辑创建与演讲者对口型的视频

发布日期:2017-07-12 08:52:06 稿源：cnBeta.COM

此前已经有一家创业公司推出语音合成服务，通过对60秒语音文档的部分信息进行筛选采集，随后进行重组，最后可以变成任何人的声音。现在华盛顿大学的研究人员已经创建了一个将音频剪辑转换成与演讲者对口型的视频的系统。

为了使这个系统工作，需要分析大约14个小时的现场演讲视频- 研究人员希望能够显着减少这个数字，也许减少至一个小时。随后他们利用神经网络进行改进。当系统被提供包括演讲人员的“目标视频”（他们可以在其中谈论任何东西）时，连同他们的音频文件说出所需的单词，它将两者组合在一起。它可以通过放弃视频的原始音频，将其替换为所需的音频，并将计算机模拟版本的演讲者的口型加入到视频中。最终的结果是，人们听到他们说出所需要的话，而且看起来也是这样。

助理教授 Ira Kemelmacher-Shlizerman表示：“现实的音频-视频转换具有实际应用，例如会议的改进视频会议，以及能够通过从音频创建视觉来与虚拟现实中的历史人物进行对话等。这是一种有助于实现下一步措施的突破。”

查看网友评论返回完整版观看

最新资讯

加载中...

Facebook针对线上商家推出专门应用并上线免费人脸认证系统

乌克兰无人机连续袭击俄电商仓库俄本土经济承压

宇树发布新款轮足机器人As2-W：可实现6m/s高速疾驰

《EA Sports FC 27》现已开启预购国区标准版248元

英特尔重申CPU开发计划超线程技术2028年回归

中国AI模型成功抵御OpenAI这场“史无前例”网络攻击

多所大学因准确性担忧放弃AI检测工具学术诚信评估面临困境

菲尔兹奖新晋得主齐默尔曼加入OpenAI 主攻AI安全

罕见“超级木星”NGTS-38 b获证实公转周期长达半年

印度要求下架杰克·多西主导的去中心化离线通信应用Bitchat

利益分歧引发内部摩擦长鑫存储被曝曾将华为驻场工程师驱逐出研发基地

今日最热

加载中...

曝小红书正私下联系员工和解陈浩：拒绝线下面谈

美股“七巨头”迎15个月来最惨烈一天

男子频繁入住电竞酒店只为偷内存条半个月共偷了16根

Google Gemini月活逼近十亿大关

据报Intel、AMD与中国AI企业锁定年度CPU供货协议价格大涨40%

印度政府封锁德里市中心移动网络以应对大规模青年抗议

AMD发布全球首款2nm GPU和CPU 联手史上最大芯片还给机器人造了颗芯

无社交无浏览器的“反智能”折叠按键手机Light Flip亮相售价299美元

长三乙成功发射天链二号06星火箭飞行途中遭遇雷击

《生活大爆炸》新衍生剧褒贬不一套路品鉴得太多了端下去吧

科技日报专访菲尔兹奖得主邓煜：“不能为了拿奖去做研究”

返回上一页首页 | cnbeta报时: 21:26:01

文字版标准版电脑端

© 2003-2026