改进DAB⁃DETR算法的非规则交通对象检测.pdf

上传人：爱文献爱资料

文档编号：21772994

上传时间：2024-04-28

格式：PDF

页数：8

大小：2.87MB

《改进DAB⁃DETR算法的非规则交通对象检测.pdf》由会员分享，可在线阅读，更多相关《改进DAB⁃DETR算法的非规则交通对象检测.pdf（8页珍藏版）》请在文库网上搜索。

1、现代电子技术Modern Electronics Technique2023年11月1日第46卷第21期Nov.2023Vol.46 No.210 引言交通是国民经济的命脉，交通安全与人民群众生命财产安全、社会稳定和长治久安以及国民经济高质量发展密切相关。道路交通事故占交通事故的绝大多数，据统计，近五年我国道路交通事故年均发生接近25万起，年均造成死亡人数超6万人，财产损失近14亿元，且仍处于道路交通事故发展的上升期。因此，本文通过对非规则改进DABDETR算法的非规则交通对象检测林峰1，2，宁琪琳1，朱智勤2（1.重庆邮电大学通信与信息工程学院，重庆 400065；2.重庆邮电大学自

2、动化学院，重庆 400065）摘要：非规则交通对象主要指任何在车辆行驶过程中可能对车辆行驶起到阻碍作用的物体，例如坑洼、落石、树枝等影响车辆正常驾驶的目标。针对道路中的非规则交通对象检测问题，提出一种基于改进DABDETR算法的非规则交通对象目标检测算法，经过对原始模型结构的分析，发现在图像特征输入编码器前加入绝对位置编码来弥补图像位置信息的缺失，只能隐式地表达特征间的相对位置信息，因此改进DABDETR在Transformer的编码结构中的多头自注意力机制中添加了针对图像的相对位置编码；其次发现在原始训练策略中，对得到的检测定位结果与类别信息进行二分匹配并计算损失值时，只是简单地将定位损失

3、和分类损失加权求和，这样会导致性能下降，所以在训练策略中增加了将分类、定位损失集成在一个统一参数化公式中的AP损失函数。实验结果表明：改进DABDETR算法的检测精度达到了82.00%，比原始模型提高了3.3%，比传统模型Faster RCNN、YOLOv5分别提高了6.20%、7.71%。关键词：非规则交通对象；目标检测；DABDETR算法；相对位置编码；AP损失函数；消融实验中图分类号：TN911.7334；TP751 文献标识码：A 文章编号：1004373X（2023）21014108Irregular traffic object detection by improved DABD

4、ETR algorithmLIN Feng1,2,NING Qilin1,ZHU Zhiqin2(1.School of Communications and Information Engineering,Chongqing University of Posts and Telecommunications,Chongqing 400065,China;2.School of Automation,Chongqing University of Posts and Telecommunications,Chongqing 400065,China)Abstract：Irregular tr

5、affic objects mainly refer to any objects that may play an obstructive role in vehicle driving,such as potholes,falling rocks,tree branches and other objectives that affect the normal driving of vehicles.Therefore,an irregular traffic object detection algorithm based on improved DABDETR(dynamic anch

6、or boxes are better queries for DETR)is proposed.By analyzing the structure of the original model,it is found that the absolute position encoding is added before the image features are input into the encoder to make up for the lack of image location information can only implicitly show the relative

7、location information between features.Therefore,in the improved DAB DETR algorithm,the relative location encoding for images is added to the multiheaded selfattention mechanism in the encoding structure of transformer.When binary matching is carried out on both the obtained detection and positioning

8、 results and the category information and then the loss value is calculated,the localization loss and classification loss are simply weighted and summed,which may lead to decreased performance,so an AP loss function that integrates the classification and localization losses in a unified parameterize

9、d formula is added to the improved strategy.The experimental results show that the detection accuracy of the improved DABDETR algorithm can reach 82.00%,which is 3.3%higher than that of the original model,and 6.20%and 7.71%higher than those of the traditional models Faster RCNN and YOLOv5,respective

10、ly.Keywords：irregular traffic object;object detection;DABDETR algorithm;relative position encoding;AP loss function;ablation experimentDOI：10.16652/j.issn.1004373x.2023.21.026引用格式：林峰，宁琪琳，朱智勤.改进DABDETR算法的非规则交通对象检测J.现代电子技术，2023，46（21）：141148.收稿日期：20230510 修回日期：20230529基金项目：重庆市教委“成渝地区双城经济圈建设”科技创新项目（KJC

11、XZD2020028）141141现代电子技术2023年第46卷交通对象（任何在车辆行驶过程中可能对车辆行驶起到阻碍作用的物体）检测的研究来减少道路交通事故的发生。目前对于道路上障碍物的检测和识别主要依靠毫米波雷达、激光雷达以及机器视觉。毫米波雷达的结构简单、价格比较便宜，但感知距离过短、分辨率较低；激光雷达精度高、分辨力强，但价格比较昂贵，易受干扰；而机器视觉通过摄像头采集图像并处理图像信息来实现人的视觉功能，采集图像所用摄像头的成本低，各类算法发展迅速，已经在实时性、精度等方面达到较高的水平1。因此本文使用机器视觉中目标检测的方法实现对非规则交通对象的检测。当前的目标检测算法主要分为传统方

12、法和基于深度学习的方法。传统的目标检测方法是在采集的图像上利用不同比例的滑动窗口提取候选区域；再利用人工设计的特征算子如 SIFT2、Harr3和 HOG4等聚合图像特征；最后再对特征进行分类。但是这种方法已经落后于当下流行的深度学习模型，它最大的缺陷就是泛化性能差，人工设计的特征算子受外观背景等因素的影响，不能适用多种场景。基于深度学习的目标检测方法主要分为两阶段目标检测器 RCNN 系列57、单阶段目标检测器 YOLO8、SSD9、端到端目标检测器 DETR10（Detection Transformer）等。RCNN系列的思想主要是：首先针对图像生成N个候选框，再对候选框

13、进行特征提取，最后进行分类和回归；YOLO系列直接将图像分成NN大小的子区域，并预测每个子区域存在物体的概率、类别以及位置偏移量，在具有较高检测精度的同时，也具有较快的运算速度。然而，RCNN系列和YOLO系列都需要复杂的后处理操作，它们在检测阶段会生成许多锚点框，但一个物体只需要一个检测框，这样就需要通过非极大值抑制（NMS）11的方法去除冗余的框，在网络训练过程中需要复杂的调参。DETR是 Facebook AI的研究人员在 2020年提出的一种新的目标检测范式，很大程度上解决了上述 RCNN系列和 YOLO系列的问题，其结构如图 1所示。图1 DETR的整体架构但是 DETR作为一种新的

14、目标检测思路，还拥有不少的问题，例如训练收敛极其缓慢、查询冗余等，后来的研究者针对这些问题，不断地优化改进，涌现很多优秀的方法，例如 Deformable DETR12、Conditional DETR13、DABDETR14等。其中 DABDETR 将动态框的中心点坐标和宽高信息组成四维信息作为目标查询，并在层之间不断更新，提高了模型的定位能力和对目标尺度信息的建模能力。因此本文在基于 Transformer15的端到端目标检测方法 DABDETR（Dynamic Anchor Boxes Are Better Queries for DETR）的基础上进行改进，简化检测过程并提升对非规则交

15、通对象的检测精度。1 DABDETR算法原理DABDETR是由清华大学、香港科技大学等研究人员提出的将box信息作为DETR中Transformer解码器查询机制中的查询并结合上下文查询进行双重查询的算法，通过这些查询来寻找与 box、上下文有相似性的目标，并逐层动态更新，这样的改进相当于添加了明确的位置先验和尺度信息，缩短了原先的随机初始化查询不断更新迭代从0查询目标位置的过程，极大地加快了收敛速度。编码器中的查询机制如图2所示。在解码器中有两个注意力模块16，每个模块都需要查询、键和值进行基于注意力的特征聚合，但是这两个注意力模块对应的三个输入是不同的。用以下公式来表示多头自注意力的三个输

16、入：PE()Aq=PE()xq,yq,wq,hq=Cat()PE()xq,PE()yq,PE()wq,PE()hq（1）Qq=Cq+MLP()Cat()PE()xq,PE()yq,PE()wq,PE()hq（2）Kq=Cq+MLP()Cat()PE()xq,PE()yq,PE()wq,PE()hq（3）Vq=Cq（4）式中：Aq代表查询中的其中一个 box信息；PE代表对输入查询进行正弦位置编码；Cat指进行维度方向上的拼接；Cq指上下文查询。对于交叉注意力则用以下公式表示：142第21期Qq=Cat()Cq,PE()xq,yq MLP()csq()CqKx,y=Cat()Fx,y,PE()x

17、,y,Vx,y=Fx,y （5）式中：Fx,y是由编码器输出()x,y位置的图像特征；MLP()csq是指针对多头自注意力的输出进行操作；查询和键的PE操作都是针对二维坐标。图2 DABDETR中解码器的结构DABDETR模型的损失由分类损失、目标边界框损失两个部分组成，具体的损失公式为：L(y,y)=i=1N-lg p()i()ci+ci Lbox()bi,b()i（6）式中：是对输出集合和真实值进行二分匹配排序后得到的最低匹配代价；ci为类别标签；bi表示真实框的向量；是权重系数。分类损失是交叉熵损失，目标边界框的损失由L1损失和IoU损失17进行线性组合，其公式

18、为：Lbox()bi,b()i=L1bi-b()i1+IoULIoU()bi,b()i（7）2 改进后的DABDETR检测模型在使用DABDETR进行训练时主要发现两个问题：第一，在图像特征输入编码器前加入绝对位置编码来弥补图像位置信息的缺失，这个操作只能隐式地表达特征间的相对位置信息，而相对位置信息对于Transformer结构去捕获输入图像特征序列的排序非常重要18；第二，对模型得到的目标定位与类别信息的集合进行二分匹配并计算损失值的这个过程中，只是简单地将定位损失和分类损失加权求和，这样可能导致性能下降。本文对这两个问题在以下方面进行了改进：在编码器的自注意力机制中增加了相对位置编码，考

19、虑了查询与相对位置的交互；在计算损失过程中，增加了将定位和分类 AP损失统一表示的参数化损失函数（paploss），并采用自动参数搜索算法搜索最佳参数，改进后的模型结构如图3所示。图3 改进后的DABDETR总体结构林峰，等：改进DABDETR算法的非规则交通对象检测143现代电子技术2023年第46卷2.1 相对位置编码相对位置编码通过在自注意力机制中加入输入特征间的相对位置信息来提升模型的表达能力。自我注意力机制在Transformer中扮演着重要的作用，它将一个查询和一组键值映射到一个输出，具体映射公式为：zi=j=1nij(xjWV)（8）式中：zi是由输入序列xj与使用softma

20、x计算得来的ij权重系数相乘求和得到的；WV是参数矩阵。ij的计算公式为：ij=exp(eij)k=1nexp(eik)（9）式中，eij通过缩放点积比较两个输入元素计算得到：eij=()xiWQ()xjWKTdz （10）式中：WQ、WK是参数矩阵。文献1920提出的相对位置编码都依赖于输入，因此本文在编码器的多头自注意力结构中添加了文献21提出的一种上下文模式的方向性图像相对位置编码。图 4显示了针对查询进行二维相对位置编码的自注意力模块。这种方法增加了相对位置编码与上下文查询的交互，这种交互可以用以下公式表示：eij=()xiWQ()xjWKT+()xiWQrTijdz （11）式中ri

21、j是可学习的相对偏置向量，通过定向映射的方式计算。将两个方向上的位置偏移构成索引对进而产生位置编码：rij=PIx()i,j,Iy()i,jIx()i,j=g()xi-xj，Iy()i,j=g()yi-yj（12）式中：g()是将相对位置映射为权重的分段函数；P用来存储相对位置权重；Ix()i,j，Iy()i,j是P的二维索引。图4 针对查询的二维相对位置编码2.2 参数化AP损失在原始模型的训练中分类和定位任务是由两个独立损失驱动的，这种差别可能导致性能的下降，为解决这种不平衡问题，文献22提出了一种新的损失框架APloss，它直接使用排序方法来代替分类损失，促使正样本预测框的得分在负样本得

22、分序列中尽可能靠前。但是这种手工设计的梯度对于驱动网络训练来说是次优的。因此，本文在计算损失过程中增加了将分类和定位损失集成在一个统一参数化公式中的 AP 损失函数23，公式如下：L=-1|Pi f()l()bi;1-j ,j if()sj-si;2()1-f()l()bj;31+j ,j if()sj-si;4 f()l()bj;5（13）假设模型每个类别输出N个检测框，这个集合用=()bi,siNi=1表示，这些检测框都会尝试与真实框进行匹配，被匹配到真实框的预测框集合称为正样本集合O，在式（13）中，将l()bi定义为第i个检测框的定位分数：l()bi=IoU()bi,bi*,i O0,

23、other （14）式中bi*指匹配到的真实框。f()x;是分段可微分函数，假设有M段，第k段被定义为：fk()x;=yk+1-ykxk+1-xk()x-xk+yk,xk x xk+1,k=0,1,2,M-1 （15）式（15）这一段函数被(xk,yk)和(xk+1,yk+1)这两个点控制，而这些点的坐标构成了集合，参数化 AP损失的最佳参数集是通过优化 AP指标在验证集上的性能而找到的。的巨大参数空间使得手动确定所需的参数是不切实际的，所以最后采用基于 PPO224强化学习的算法对参数集进行搜索，将搜索的最佳参数代入进行训练。3 实验结果与分析3.1 实验环境本文的所有实验在表1的环境中进行

24、。表1 实验环境名称CPUGPU内存深度学习框架操作系统配置Intel CoreTM i78700 CPU3.20 GHzNVIDIA GeForce GTX 1050 Ti8.00 GBPython 3.7.13,Pytorch 1.8.1Windows 10(64位)144第21期3.2 非规则交通对象数据集目前针对本文所涉及的非规则交通对象而言，没有相关的公开数据集，因此通过在网上搜集、公开数据集抽取等方法共收集包含坑洼、落石、树枝以及道路上经常出现的动物等非规则交通对象的 7 323张图片，将数据集以 8 2 的比例划分为训练集和测试集。使用LabelIm

25、g标注工具对采集到的图片进行标注，标注后的图片效果如图5所示。图5 标注后图片效果3.3 评价指标mAP（mean Average Precision）即均值平均准确率，是常用的目标检测评价指标之一，它表示的是训练中所有类别 PrecisionRecall 曲线下面积的平均值，其中，Precision（Pr）、Recall（Re）的计算公式如下：Pr=TPTP+FP（16）Re=TPTP+FN（17）式中：TP是指在所有正样本中被识别为正样本的个数；FP是指所有负样本中被识别为正样本的个数；FN是指所有正样本中被识别为负样本的个数；Pr是指所有样本中被识别为正样本的概率；Re是指所有正样本中被

26、识别为正样本的概率。在这里样本的划分由手动确定的交并比IoU决定，IoU计算过程如下：IoU=Agt ApAgt Ap（18）式中：Agt、Ap分别代表真实框和预测框；IoU表示两个框的重合程度。3.4 消融实验为了验证算法每个改进模块的有效性，设计了消融实验，在实验过程中，每组实验都对数据进行一系列预处理操作，例如图片通过随机水平翻转、随机裁剪等进行数据增强，都使用AdamW优化器。同时，为了验证模型中查询box（qbox）与预测box（pbox）对模型性能的影响，添加了一组实验。所有实验均训练50轮，分为两个阶段：第一阶段为40轮，这一阶段将模型的学习率设置为 0.000 01，并以 0.

27、000 1 的权重进行衰减，每次将 1 张图片送入 GPU进行处理，这个阶段损失值将大幅下降；第二阶段将经过 40轮衰减后的学习率再缩小 10倍，并以同样的衰减权重对学习率进行下调。实验结果如表2所示。表2 加入不同改进模块后的精度对比原始模型DABDETRDABDETRDABDETRDABDETRDABDETRDABDETR相对位置编码参数化AP损失qbox/pbox303030504030AP50/%78.7080.0080.9080.3079.8082.00表2显示，DABDETR算法在qbox/pbox为30的前提下单独加入相对位置编码或参数化 AP损失，模型的精度都会有效提升；改变

28、qbox/pbox的大小后，模型性能不同程度下降。以上实验充分证明了两种改进对DABDETR算法的性能有较大提高。同时，为了更深入地探究改进模块提升模型性能的本质原因，通过不同的实验进行了以下分析。3.4.1 相对位置编码有效性分析为了探究在编码器自注意力机制中所添加的相对位置编码提升检测结果的机理，本文对添加相对位置编码前后的模型进行了可视化实验，提取编码器最后一层的输出激活值，通过 GradCAM25对输出值在原图上绘制出热力图，然后进行进一步分析，改进前后的可视化对比如图6所示。图6 改进前后可视化对比林峰，等：改进DABDETR算法的非规则交通对象检测145现代电子技术2023年第4

29、6卷从图 6中可以得出在加入相对位置编码后，特征注意力集中到了一部分区域，在经过多层改进的编码器后，模型已经获得足够多的局部信息。如果没有相对位置编码，Transformer结构不会明确地知悉特征间的相互关系，会过多地关注不必要的信息，限制模型的检测能力。因此，加入相对位置编码对于依赖Transformer结构的模型会有有效的帮助。图 7 记录了 DABDETR 仅加入相对位置编码的损失值变化，可见相对位置编码并不会影响模型的收敛。图7 加入相对位置编码后的损失值变化3.4.2 参数化AP损失有效性分析在训练过程中记录并提取了定位、分类损失及它们统一参数化后的AP损失变化过程，如图8所示。其中

30、，loss_bbox为目标边界框损失，由公式（7）得出，loss_ce是由类别预测的负对数所表示的分类损失，loss_giou由公式（19）得出。loss_pap为统一参数化后的AP损失，由公式（13）得出。GIoU=IoU-C-()A BC,LGIoU=1-GIoU（19）式中：A表示预测框；B表示真实框；C表示包含A、B框的最小矩形框。从图 8 可以看出，定位损失和分类损失的差值较大，在原始模型中对这两部分损失进行加权求和，权值的大小可能对最终损失值产生较大影响，而它们经过统一的参数化函数重新表述后，形成了图中“”代表的AP损失曲线，它介于定位和分类损失两者曲线之间，有一个较为平缓的下降收

31、敛过程，模型优化过程更为平滑，而且对模型性能有较大提升，在最终测试结果中相比未对损失函数进行优化的检测模型提升了2.2%。3.5 横向对比实验将本文改进后的算法在所采集的数据集上与常见的算法进行了对比，如表3所示。每个模型都使用相同的数据增强方法，都使用AdamW优化器，在本文制作的数据集上进行50轮训练，由于本文数据集中非规则交通对象的大小不一，故使用AP50、AP50:95对模型性能进行对比。图8 参数化AP损失相关的各类损失变化表3 不同检测算法的精度对比%模型Faster RCNNYOLOv5SSDRetinaNetDABDETR本文AP5075.8074.2974.6079.607

32、8.7082.00AP50:9553.3052.7054.1053.4058.0059.80从表3可知，在非规则交通对象检测场景下，本文在常规检测指标以及针对大小不一的特殊数据集所采用的指标均高于常见的检测算法。本文通过对交通场景中选取的一些图片进行检测，得到的检测结果如图9所示。4 结语本文提出一种基于改进 DABDETR 的非规则交通对象检测方法。针对原有算法 DABDETR 中两个问题进行分析研究，在模型结构中添加了可以捕获明确输入特征关系的相对位置编码，并在训练策略中添加了能提高模型性能的统一参数化 AP损失函数。最后，在采集的非规则交通对象数据集上进行了充分的消融对比实验，证明了改

33、进算法的有效性，能够准确识别和定位道路上的非规则交通对象。本文的研究成果也可以推广到类似DETR的结构中，对相关研究进行有效支撑。注：本文通讯作者为宁琪琳。146第21期参考文献1 李洋.智能车辆障碍物检测技术综述J.大众科技，2019，21（6）：6568.2 LOWE D G.Distinctive image features from scaleinvariant keypoints J.International journal of computer vision,2004,60(2):91110.3 LIENHART R,MAYDT J.An extended set of Ha

34、arlike features for rapid object detection C/Proceedings of the 2022 International Conference on Image Processing.NY,USA:IEEE,2002:900903.4 DALAL N,TRIGGS B.Histograms of oriented gradients for human detection C/2005 IEEE Computer Society Conference on Computer Vision and Pattern Recognition(CVPR 20

35、05).NY,USA:IEEE,2005:886893.5 GIRSHICK R,DONAHUE J,DARRELL T,et al.Rich feature hierarchies for accurate object detection and semantic segmentation C/Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition.NY,USA:IEEE,2014:580587.6 GIRSHICK R.Fast RCNN C/Proceedings of the IEEE

36、 International Conference on Computer Vision.NY,USA:IEEE,2015:14401448.7 REN S,HE K,GIRSHICK R,et al.Faster RCNN:Towards realtime object detection with region proposal networks C/Advances in Neural Information Processing Systems 28:Annual Conference on Neural Information Processing Systems 2015.S.l.

37、:s.n.,2015:9199.8 REDMON J,DIVVALA S,GIRSHICK R,et al.You only look once:Unified,real time object detection C/Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition.NY,USA:IEEE,2016:779788.9 LIU W,ANGUELOV D,ERHAN D,et al.SSD:Single shot multibox detector C/Proceedings of 14th

38、 European Conference on Computer Vision(ECCV 2016).Heidelberg,Germany:Springer International Publishing,2016:2137.10 CARION N,MASSA F,SYNNAEVE G,et al.Endtoend object detection with transformers C/European Conference on Computer Vision.Heidelberg,Germany:Springer,2020:213229.11 NEUBECK A,VAN GOOL L.

39、Efficient nonmaximum suppression C/18th International Conference on Pattern Recognition(ICPR 2006).NY,USA:IEEE,2006:850855.12 ZHU X,SU W,LU L,et al.Deformable DETR:Deformable transformers for endtoend object detection EB/OL.20221105.https:/arxiv.org/abs/2010.04159.13 MENG D,CHEN X,FAN Z,et al.Condit

40、ional DETR for fast training convergence C/Proceedings of the IEEE/CVF International Conference on Computer Vision.NY,USA:IEEE,2021:36313640.14 LIU S,LI F,ZHANG H,et al.DABDETR:Dynamic anchor boxes are better queries for DETR EB/OL.2022 10 19.https:/arxiv.org/abs/2201.12329.15 VASWANI A,SHAZEER N,PA

41、RMAR N,et al.Attention is all you need EB/OL.2023 08 02.https:/arxiv.org/pdf/1706.03762.pdf.16 HU J,SHEN L,SUN G.Squeezeandexcitation networks C/Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition.NY,USA:IEEE,2018:71327141.17 YU J,JIANG Y,WANG Z,et al.Unitbox:An advanced ob

42、ject detection network C/Proceedings of the 24th ACM International Conference on Multimedia.New York:ACM,2016:516图9 在测试集上的检测结果图林峰，等：改进DABDETR算法的非规则交通对象检测147现代电子技术2023年第46卷520.18 田永林，王雨桐，王建功，等.视觉 Transformer研究的关键问题：现状及展望J.自动化学报，2022，48（4）：957979.19 SHAW P,USZKOREIT J,VASWANI A.Selfattention with rel

43、ative position representations C/Proceedings of the 2018 Conference of the North American Chapter of the Association for Computational Linguistics:Human Language Technologies.Stroudsburg,PA:ACL,2018:464468.20 HUANG Z,LIANG D,XU P,et al.Improve transformer models with better relative position embeddi

44、ngs EB/OL.20200928.https:/arxiv.org/abs/2009.13658.21 WU K,PENG H,CHEN M,et al.Rethinking and improving relative position encoding for vision transformer C/Proceedings of the IEEE/CVF International Conference on Computer Vision.New York:IEEE,2021:1001310021.22 CHEN K,LI J,LIN W,et al.Towards accurat

45、e onestage object detection with AP Loss C/Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition.New York:IEEE,2019:51195127.23 TAO C X,LI Z Z,ZHU X Z,et al.Searching parameterized AP loss for object detection M/RANZATO M A,BEYGELZIER A,DAUPHIN Y N,et al.Advances in neura

46、l information processing systems 34:annual conference on neural information processing systems.S.l.:s.n.,2021:2202122033.24 SCHULMAN J,WOLSKI F,DHARIWAL P,et al.Proximal policy optimization algorithms EB/OL.20170828.https:/arxiv.org/abs/1707.06347.25 SELVARAJU R,COGSWELL M,DAS A,et al.GradCAM:Visual explanations from deep networks via gradientbased localization C/Proceedings of the IEEE International Conference on Computer Vision.New York:IEEE,2017:618626.作者简介：林峰（1978），男，硕士，高级工程师，研究方向为5GV2X车联网通信、智能终端与系统。宁琪琳（1998），男，硕士研究生，研究方向为计算机视觉、目标检测。朱智勤（1988），男，博士，副教授，研究方向为图像处理、模式识别、机器学习。148