专利 一种面向高清图像的目标检测算法改进方法

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 20221026808 8.X (22)申请日 2022.03.17 (71)申请人常州得一电子科技有限公司地址 213000 江苏省常州市新北区华山中路9号 (72)发明人汪丛笑　徐金陵　刘天壁　李荣夫　 (74)专利代理机构常州市权航专利代理有限公司 32280 专利代理师黄晶晶 (51)Int.Cl. G06V 10/774(2022.01) G06V 10/80(2022.01) G06V 10/82(2022.01) G06K 9/62(2022.01) G06N 3/04(2006.01)G06N 3/08(2006.01) (54)发明名称一种面向高清图像的目标检测算法改进方法 (57)摘要本发明公开了一种面向高清图像的目标检测算法改进方法，具体包括以下步骤：步骤一、目标定义；步骤二、目标训练；步骤三、坐标定位；步骤四、检测整合；步骤五、坐标整合；步骤六、重复滤除；步骤七、目标整合，本发明涉及数字图像处理领域以及深度学习及计算机视觉领域。该面向高清图像的目标检测算法改进方法，充分利用高分辨率的像素信息，在不改变卷积神经网络结构的基础上将画面中的关键小目标检测出来，并且通过双目视觉技术，构建临时三维坐标系，对得到检测结果的坐标信息和车辆实时坐标进行整合，有效消除因为图像处理导致的位置信息差。权利要求书1页说明书6页附图3页 CN 114663723 A 2022.06.24 CN 114663723 A 1.一种面向高清图像的目标检测算法改进方法，其特征在于：具体包括以下步骤：步骤一、目标定义：将特定ROI定义为一种目标类型；步骤二、目标训练：在训练数据集中补充标注ROI目标，训练深度学习模型；步骤三、坐标定位：车载双目摄像头获取二维图像，定位为原图，同时采集车载双目摄像头实时坐标；步骤四、检测整合：对原图进行第一级目标检测，获得ROI目标，将ROI目标从原图中截图出来，获得二级目标检测原件，随后将二级目标检测原件输入深度学习模型执行第二级目标检测，得到的第二级检测结果映射至原图；步骤五、坐标整合：通过双目视觉转化技术将步骤四中采集的二级目标检测原件在原图中的三维坐标展示出来，并与步骤三中车载双目摄像头的坐标进行关联计算，得出对应二级目标检测原件与车载双目摄像头之间的直线距离和方位，并构建出临时三维坐标系；步骤六、重复滤除：将步骤四中映射后的两级目标检测结果进行融合，滤除全图检测的非ROI目标和ROI检测出来的目标中重复的目标框，将多个重复检测的目标框仅保留一个有效者；步骤七、目标整合：采集步骤六中获得融合结果时车载双目摄像头的坐标信息，将此时车载双目摄像头的坐标信息代入到步骤五中构建的临时三维坐标系中，获取此时车载双目摄像头与目标检测结果之间的实时距离和方位。 2.根据权利要求1所述的一种面向高清图像的目标检测算法改进方法，其特征在于：所述步骤二中的训练数据集用于训练基于深度学习的通用目标检测算法，用于添加新的目标种类。 3.根据权利要求1所述的一种面向高清图像的目标检测算法改进方法，其特征在于：所述步骤四中以抠图的方式将ROI目标从原图中截图出来，并将二级目标检测原件以batch的形式输入深度学习模型，执行第二级目标检测。 4.根据权利要求1所述的一种面向高清图像的目标检测算法改进方法，其特征在于：所述步骤四中的映射具体包括：根据ROI在原图的坐标位置及大小，将ROI内的目标映射到原图的坐标系内。 5.根据权利要求1所述的一种面向高清图像的目标检测算法改进方法，其特征在于：所述步骤五中的关联计算包括如下步骤： a、根据步骤三中采集的车载双目摄像头实时坐标，构建相机坐标系； b、利用双目视觉转化技术将原图转化为三维图像，并将二级目标检测元件作为标准单位在三维图像中的三维坐标代入到相机坐标系中，构建出临时三维坐标系。 6.根据权利要求1所述的一种面向高清图像的目标检测算法改进方法，其特征在于：所述步骤六中滤除的目标框包括在原图上表现为多个位置接近、大小相似堆叠在一起的目标框。权　利　要　求　书 1/1 页 2 CN 114663723 A 2一种面向高清图像的目标检测算法改进方法技术领域 [0001]本发明涉及数字图像处理领域以及深度学习及计算机视觉领域，具体为一种面向高清图像的目标检测算法改进方法。背景技术 [0002]数字图像分析技术在当今社会发挥着重要作用，其中图像目标检测技术是一个重要的组成部分。目前目标检测技术的发展已经逐渐抛弃传统数字图像处理的手工设计算法的方案，转而使用深度学习，以卷积神经网络（Convolutional Neural Network， CNN）为代表，以达到高准确率的目标检测结果。然而，对于现有的CNN模型，普遍使用统一的图像数据输入，无论实际场景下的图像分辨率如何，全部统一为同一种或几种预先设定的分辨率。这种做法对算法的实际应用是一种巨大的限制，因此需要一种能够对实际图像分辨率进行适配的算法，以充分利用图像数据信息。 [0003]计算机视觉在很多应用领域达到了实用水平，催生了工业界的大量应用。其最重要的原因是深度学习可以做到传统方法无法企及的精度，尤其是基于卷积神经网络CNN的深度学习模型，现在已经成为计算机视觉的主流方法。 [0004]卷积神经网络是一种常见的深度学习网络架构，受生物自然视觉认知机制启发而来。 CNN能够得出原始图像的有效表征，这使得CNN能够直接从原始像素中，经过极少的预处理，捕获到视觉上面的规律。 [0005]目标检测是当前最热的话题之一，它需要对很多对象进行分类和定位。基于深度学习的目标检测，主要有两类模型：对于单张图像中的目标检测，使用基于region proposal的检测方法，以faster rcnn为代表的two ‑stage方案，能够达到很高的准确率；考虑到two‑stage方案的效率不够高，针对实时场景的YOLO、 SSD等one ‑stage算法应运而生，在保持相对不错的准确率的情况下，可以快速对图像进行目标检测。 [0006]目前几乎所有的深度卷积神经网络，都要求图像在输入模型之前统一到一个或多个预先设定好的分辨率。这种限制的存在，不可避免对图像进行缩放、拉伸、切割等操作，导致图像内的对象变形，像素信息大量损失。对于大分辨率图像来说，缩小图像浪费了宝贵的图像信息，造成准确率下降。现今高清摄像机已经非常普及，可以拍摄1080p、 2K、 4K等分辨率的画面；拍摄单张图像则能够达到更高的分辨率。而用于目标检测的卷积神经网络能够处理的图像一般是512 ×512、 608×608、 640×640等较小的分辨率。对于卷积神经网络来说，高分辨率带来的丰富像素数据信息并没有让算法受益，因为在输入网络之前，图像需要缩小至固定分辨率而丢弃大量信息。 [0007]小目标检测效果不佳一直是目标检测算法里的痛点，但是高清分辨率的图像在客观上能提供改善小目标检测效果的数据信息，卷积神经网络限于自身的结构无法充分利用图像信息，并且在摄像设备产生移动时，特别是车载摄像设备，由于小目标检测处理过程中，具有短暂的延迟，容易产生位置信息差，为此，特提出一种面向高清图像的目标检测算法改进方法，提高小目标检测精确度的同时，有效避免了车载摄像设备移动过程中信息差说　明　书 1/6 页 3 CN 114663723 A 3

专利 一种面向高清图像的目标检测算法改进方法

专利一种面向高清图像的目标检测算法改进方法