返回上一页  首页 | cnbeta报时: 19:18:27
IBM希望通过新的不同数据集来改善面部识别的种族偏见
发布日期:2018-06-28 02:20:25  稿源:cnBeta.COM

种族识别成功率差异是面部识别中的一个大问题,研究表明,如果对象是白人和男人,商业系统会更加准确。部分原因是培训数据缺乏多样性,有色人种的出现频率低于同龄人。 IBM是试图解决这个问题的公司之一,并且今天宣布了两个新的公共数据集,任何人都可以使用它来训练面部识别系统,其中一个专门用来帮助消除偏见。

第一个数据集包含100万张图像,并将帮助培训能够识别特定属性的系统,如头发颜色,眼睛颜色和面部毛发。每张脸都有这些特征的注释,使程序员更容易磨练他们的系统,以更好地区分山羊胡和其他胡须。这不是用于训练面部识别系统的最大的公共数据集,但是IBM表示包含这种标签的规模最大。

第二个数据集是更有趣的一个。它比第一张还要小,包含36,000张照片,但内部的人脸是相同的种族,性别和年龄组合。就像人脸属性标签帮助训练AI系统识别这些差异一样,拥有多种面部组合可以帮助系统克服各种偏见。这两个数据集均来自张贴到Flickr的带有Creative Commons许可证的照片,这些照片经常可以用于研究目的。

IBM的商业面部识别系统在过去被批评为存在明显的种族偏见。麻省理工学院媒体实验室2月份发表的一项研究发现,IBM识别黑皮肤女性性别的错误率接近35%,而识别白人男性错误率仅为1%。这些错误将变得越来越重要,因为面部识别系统被用于从雇用到识别犯罪嫌疑人的任务。

IBM表示正在努力改善这些错误,并且其面部识别系统的更新版本使用了更广泛的训练集(比如今天公布的那种训练集),以便将错误减少近十倍。然而,如果没有用于评估偏倚的标准化指标,要准确判断这些系统的改善程度仍然很难。

QQ图片20180628021328.png

查看网友评论   返回完整版观看

返回上一页  首页 | cnbeta报时: 19:18:27

文字版  标准版  电脑端

© 2003-2024