软件所等在像素级高效人手检测研究中取得进展
文章来源:智能软件研究中心 | 发布时间:2019-03-25 | 【打印】 【关闭】
近日,中国科学院软件研究所武延军团队在像素级高效人手检测领域取得新进展,为人手运动视频的实时检测估计处理提供了一种新方法,有望用于网约车、公交车等驾驶状态实时监控,减少安全事故。相关成果以Scale Invariant Fully Convolutional Network: Detecting Hands Efficiently为题发表于国际人工智能会议AAAI Conference on Artificial Intelligence (AAAI 2019),论文通讯作者为软件所助理研究员张立波。
传统人手检测方法利用人工特征提取与分类器结合,特征具有局限性,提取时间开销大,而基于深度学习的方法对尺度较小的首部区域漏检概率大,同时网络结构复杂,训练和测试时间长,不能达到实时检测的要求。
以上问题导致现有算法无法同时满足具体场景中准确率和实时性的要求,严重制约了人手检测在实时视频处理中的应用。软件所武延军团队提出了一种尺度不变的全卷积神经网络,补充加权特征融合模块学习不同尺度的特异性,对网络的中间层也加入了监督,以迭代的方式融合多个尺度的特征进行最后的预测,与当前最好方法相比,在保证精度的同时检测速度更快,将单张图像处理速度最高提升4.23倍,首次达到62.5 fps。
该研究为智能视频中的人手处理奠定了基础,在公交车/网约车安全监控、智能交通和无人驾驶等领域具有广泛应用前景。该研究工作目前得到国家自然科学基金的支持。
图1. 研究提出的网络结构: (a) 特征提取部分, (b) 特征融合部分, (c) 输出部分.
图2. 结果对比,SIFCN (青色,该研究) 和 Multi-scale fast RCNN (红色,Yan et al. 2017): (a) VIVA 数据集 (b) Oxford 数据集.