5月18日,全球权威机器视觉算法测评平台KITTI的世界纪录再此被刷新。来自中国的科技公司阿里云将其车辆检测的准确率拉升至90.46%。车辆检测被认为是实现无人驾驶的关键技术,极具挑战。据了解,此次重大技术突破是由阿里巴巴iDST视觉计算研究员华先胜领导的团队完成。
(阿里巴巴iDST团队以90.46%的准确率夺得KITTI排名第一)
他们提出了基于区域融合决策和上下文相关的多任务深度神经网络,用于复杂场景下的车辆检测任务,重点解决其中多视角,多姿态以及车辆遮挡等问题。
在网络结构设计上,团队利用反卷积操作提高了小目标的召回率,同时拼接了多层特征以融合低层的局部信息和高层的语义信息,提高了边框定位的准确率。在训练过程中,还借鉴了GAN(生成对抗网络)中的对抗训练模式。