范佳琦, 李鑫, 霍天娇, 洪金龙, 高炳钊, 陈虹
在自动驾驶汽车中,深度学习算法可以对单目视觉摄像头采集到的图像进行准确地检测和识别,对于保证驾驶安全性具有重要意义。在保证实时检测的前提下,为了提高深度学习模型的检测精度和鲁棒性,以应对多种复杂的道路场景,对单阶段检测算法YOLOv3进行改进并将其应用在跨域目标检测中。首先,在数据预处理阶段,根据各类目标物形状和尺寸的差异,重新定义了计算候选框尺寸的K-means聚类算法公式;在主干网络结构上,基于特征金字塔网络,对提取到的深层像素特征和浅层空间特征进一步融合,以提取更加丰富的目标物信息;此外,主干网络同时使用了通道注意力模块和空间注意力模块,以关注不同维度的特征并对特征进行细化,使提取到的目标物信息更加完整。为了将模型更好地应用到跨域目标检测任务中,利用无监督CycleGAN算法对多种不同场景中采集到的图像进行风格转换,并将其与改进后的YOLOv3算法相结合完成对这些场景中的目标检测。试验结果表明:和YOLOv3相比,所建立的模型对于BDD100K数据集中5类目标物的平均检测精度提高了5.84%,最大检测召回率提高了4.92%;其次,利用CycleGAN算法对雨天、雾天等5种不同场景中的图像进行转换,得到5组合成图,并用所建立的模型训练这些合成图以得到多个适用于不同场景的子模型;最后,和YOLOv3相比,模型的跨域检测精度提高了5%~10%, 能够更好地完成跨域检测任务。