返回上一页  首页 | cnbeta报时: 07:40:52
阿里图像识别揭秘:每秒可扫描501本康熙字典汉字量
发布日期:2017-10-12 17:30:32  稿源:新浪科技

10月12日下午消息,在云栖大会“数据力量-社会治理的共享与共治”分论坛上,阿里巴巴平台治理部首次集中向公众展示大数据带来的社会治理变革。据介绍,通过“雷音识字”技术,对淘宝和天猫宝贝详情图平均识别准确率为97.6%,“已接近人眼识别能力。”

“2016年淘宝新开店铺为1020万家,有成交的就超过300万家,这其中约35%卖家是24岁以下的年轻人,30岁以下的创业者就占到超60%”,阿里巴巴首席平台治理官郑俊芳表示,在这个繁荣多样的生态中,“我们既要考虑消费者保护,要保证市场活跃,营造健康的创新创业环境,也要为品牌权利人提供服务保障权益。”

论坛上,阿里巴巴集团资深技术专家贾梦雷首次向公众披露“雷音识字”技术。据介绍,新广告法实施后海量的商品描述有了违规风险,而平台上90%的商品描述在图片里,比如说“顶级”、“最优质”、“极品”等。“‘雷音识字’技术需要监控全网近20亿商品,并将违规商品揪出来”,贾梦雷说,目前技术对宝贝详情图平均识别准确率为97.6%,“已接近人眼识别能力。”

那么阿里的图像识别能力到底有多强?

平台治理部公布的一组数据指出,2016年全年阿里超强的图片识别技术已累计计算1000亿张图片,每日为20亿在架宝贝的图像安全保驾护航。每日计算商品图片约6亿张,每年计算图片面积约4.26平方公里,相当于 48 个澳门特别行政区的土地面积。每秒扫描图片文字23,546,287个,相当于每秒可扫描识别501本《康熙字典》的汉字量。

目前,该图像识别技术以审核包括身份证、发票、营业执照、专利证书在内的23种资质图。“像专利证书的识别率高达99.3%,这让快速合法合规成为了可能”, 贾梦雷说。

查看网友评论   返回完整版观看

返回上一页  首页 | cnbeta报时: 07:40:52

文字版  标准版  电脑端

© 2003-2024