译者恐下岗:YouTube自动字幕系统已能识别场景音效

摘要:

过去几年,Google 已不停地 YouTube 引入了相当强大的自动字幕功能。而在最新升级之后,这套系统甚至能够识别出场景音效了!Sourish Chaudhuri 在一篇博客中写到:“尽管语音是用来沟通的最熟悉方式,但环境音效也是人们感知这个世界不可或缺的一环。我们会对环境声产生本能的反应,比如被突然的骚动吓了一跳、用音乐来烘托氛围、以及情景剧中的观众笑声”。

youtube-s-automatic-captioning-system-can-describe-sound-effects-now-514221-2.png

Pharrell Williams & Janelle Monae: "Hidden Figures" | Talks at Google

YouTube 于 2009 年引入了自动字幕功能,旨在翻译语音并让内容被更多人所接触到。然而此前视频中的环境声一直被有意无意的忽略,这对大家的观影体验产生了一些消极的影响。

YouTube 字母系统的最近进展,得益于它和 Sound Understanding、以及 Accessibility 的合作,后者为该视频网站开发出了首套自动声效翻译系统。

我们现在已经能够检测一则视频中是否存在这类音效,将之翻译并挂上合适的标签。可识别的声效类别很丰富,包括鼓掌、音乐、以及大笑等。

今年早些时候,YouTube 宣布其自动字幕翻译已经为 10 亿人次提供了服务。据该公司对一些用户的研究,2/3 的人们表示新加入的声效翻译功能增强了他们的整体使用体验。

[编译自:SoftPedia]

热门评论

>>共有0条评论,显示0
更多评论
created by ceallan