微软正式推出基于AI的视频元数据提取检索服务
在去年的开发者大会(Build 2017)上,微软首次放出了视频检索(Video Indexer)服务的预览。作为一项云服务,它能够从视频中提取视觉和语音元数据,将至用于现有的应用,以构建增强的搜索体验。一年之后,微软在上周的荷兰广播电视展(IBC 2018)上,正式宣布推出这项视频检索服务。此外,微软披露了以下新功能。
情绪识别:
基于语音、语调等音频资源模型,检测视频中某一时刻的情感。
主体推论:
根据口语、视觉线索,理解视频或音频文件的高级主题。为符合行业标准,该模型中的主题,沿用了 IPTC 分类法。
名人识别模型:
增强名人识别模型,现涵盖基于常用数据源的百万张面孔(比如 IMDB、维基百科、领英等)。
有关本次公告的更多信息,请移步至 Azure 官方博客查看:
[编译自:MSPU]