(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 20221026808 8.X
(22)申请日 2022.03.17
(71)申请人 常州得一电子科技有限公司
地址 213000 江苏省常州市新北区华 山中
路9号
(72)发明人 汪丛笑 徐金陵 刘天壁 李荣夫
(74)专利代理 机构 常州市权航专利代理有限公
司 32280
专利代理师 黄晶晶
(51)Int.Cl.
G06V 10/774(2022.01)
G06V 10/80(2022.01)
G06V 10/82(2022.01)
G06K 9/62(2022.01)
G06N 3/04(2006.01)G06N 3/08(2006.01)
(54)发明名称
一种面向高清图像的目标检测算法改进方
法
(57)摘要
本发明公开了一种面向高清图像的目标检
测算法改进方法, 具体包括以下步骤: 步骤一、 目
标定义; 步骤二、 目标训练; 步骤三、 坐标定位; 步
骤四、 检测整 合; 步骤五、 坐标整合; 步骤六、 重复
滤除; 步骤七、 目标整合, 本发明涉及数字图像处
理领域以及深度学习及计算机视觉领域。 该面向
高清图像的目标检测算法改进方法, 充分利用高
分辨率的像素信息, 在不改变卷积神经网络结构
的基础上将画面中的关键小目标检测出来, 并且
通过双目视觉技术, 构建临时三维坐标系, 对得
到检测结果的坐标信息和车辆实时坐标进行整
合, 有效消除因为图像处 理导致的位置信息 差。
权利要求书1页 说明书6页 附图3页
CN 114663723 A
2022.06.24
CN 114663723 A
1.一种面向高清图像的目标检测算法改进方法, 其特 征在于: 具体包括以下步骤:
步骤一、 目标定义: 将特定ROI定义 为一种目标类型;
步骤二、 目标训练: 在训练数据集中补充标注ROI目标, 训练深度学习模型;
步骤三、 坐标定位: 车载双目摄像头获取二维图像, 定位为原图, 同时采集车载双目摄
像头实时坐标;
步骤四、 检测整合: 对原图进行第一级目标检测, 获得ROI目标, 将ROI目标从原图中截
图出来, 获得二级目标检测原件, 随后将二级目标检测原件输入深度学习模型执行第二级
目标检测, 得到的第二级检测结果映射至原图;
步骤五、 坐标整合: 通过双目视觉转化技术将步骤四中采集的二级目标检测原件在原
图中的三维坐标展示出来, 并与步骤三中车载双目摄像头的坐标进行关联计算, 得出对应
二级目标检测原件与车 载双目摄 像头之间的直线距离和方位, 并构建出临时三维坐标系;
步骤六、 重复滤除: 将步骤四中映射后的两级目标检测结果进行融合, 滤除全图检测的
非ROI目标和ROI检测出来的目标中重复的目标框, 将多个重复检测的目标框仅保留一个有
效者;
步骤七、 目标整合: 采集步骤六中获得融合结果 时车载双目摄像头的坐标信息, 将此时
车载双目摄像头的坐标信息代入到步骤五中构建的临 时三维坐标系中, 获取此时车载双目
摄像头与目标检测结果之间的实时距离和方位。
2.根据权利要求1所述的一种面向高清图像的目标检测算法改进方法, 其特征在于: 所
述步骤二中的训练数据集用于训练基于深度学习的通用目标检测算法, 用于添加新的目标
种类。
3.根据权利要求1所述的一种面向高清图像的目标检测算法改进方法, 其特征在于: 所
述步骤四中以抠图的方式将ROI目标从原图中截图出来, 并将二级目标检测原件以batch的
形式输入深度学习模型, 执 行第二级目标检测。
4.根据权利要求1所述的一种面向高清图像的目标检测算法改进方法, 其特征在于: 所
述步骤四中的映射具体包括: 根据ROI在原图的坐标位置及大小, 将ROI内的目标映射到原
图的坐标系内。
5.根据权利要求1所述的一种面向高清图像的目标检测算法改进方法, 其特征在于: 所
述步骤五中的关联计算包括如下步骤:
a、 根据步骤三中采集的车 载双目摄 像头实时坐标, 构建相机坐标系;
b、 利用双目视觉转化技术将原图转化为三维图像, 并将二级目标检测元件作为标准单
位在三维图像中的三维坐标代入到相机坐标系中, 构建出临时三维坐标系。
6.根据权利要求1所述的一种面向高清图像的目标检测算法改进方法, 其特征在于: 所
述步骤六中滤除的目标框包括在原图上表现为多个位置接近、 大小相似堆叠在一起的目标
框。权 利 要 求 书 1/1 页
2
CN 114663723 A
2一种面向高清图像的目标 检测算法改进方 法
技术领域
[0001]本发明涉及数字图像处理领域以及深度学习及计算机视觉领域, 具体为一种面向
高清图像的目标检测算法改进方法。
背景技术
[0002]数字图像分析技术在当今社会发挥着重要作用, 其中图像目标检测技术是一个重
要的组成部 分。 目前目标检测技术的发展已经逐渐抛弃传统数字图像处理的手工设计算法
的方案, 转而使用深度 学习, 以卷积神经网络 (Convolutional Neural Network, CNN) 为代
表, 以达到高准确率的目标检测结果。 然而, 对于现有的CNN模型, 普遍使用统一的图像数据
输入, 无论 实际场景下的图像 分辨率如何, 全部统一为同一种或几种预先设定的分辨率。 这
种做法对算法的实际应用是一种巨大的 限制, 因此需要一种能够对实际图像分辨率进 行适
配的算法, 以充分利用图像数据信息 。
[0003]计算机视觉在很多应用领域达到了实用水平, 催生了工业界的大量应用。 其最重
要的原因是深度学习 可以做到传统方法无法企及的精度, 尤其是基于卷积神经网络CNN的
深度学习模型, 现在已经成为计算机 视觉的主流方法。
[0004]卷积神经网络是一种常见的深度学习网络架构, 受生物自然视觉认知机制启发而
来。 CNN能够得出原始图像的有效表征, 这使得CNN能够直接从原始像素中, 经过极少的预 处
理, 捕获到 视觉上面的规 律。
[0005]目标检测是当前最热的话题之一, 它需要对很多对象进行分类和定位。 基于深度
学习的目标检测, 主要有两类模型: 对于单张图像中的目标检测, 使用基于region
proposal的检测方法, 以faster rcnn为代表的two ‑stage方案, 能够达到很高的准确率; 考
虑到two‑stage方案的效率不够高, 针对实时场景的YOLO、 SSD等one ‑stage算法应运而生,
在保持相对不 错的准确率的情况 下, 可以快速对图像进行目标检测。
[0006]目前几乎所有的深度卷积神经网络, 都要求图像在输入模型之前统一到一个或多
个预先设定好的分辨率。 这种限制的存在, 不可避免对图像进 行缩放、 拉伸、 切割等操作, 导
致图像内的对象变形, 像素信息大量损失。 对于大分辨率图像来说, 缩小图像浪费了宝 贵的
图像信息, 造成准确率下降。 现今高清摄像机已经非常普及, 可以拍摄1080p、 2K、 4K等分辨
率的画面; 拍摄单张图像则能够达到更高的分辨率。 而用于目标检测的卷积神经网络能够
处理的图像一般是512 ×512、 608×608、 640×640等较小的分辨率。 对于卷积神经网络来
说, 高分辨率带来的丰富像素数据信息并没有让算法受益, 因为在输入网络之前, 图像需要
缩小至固定分辨 率而丢弃 大量信息 。
[0007]小目标检测效果不佳一直是目标检测算法里的痛点, 但是高清分辨率的图像在客
观上能提供改善小目标检测效果的数据信息, 卷积神经网络限于自身的结构无法充分利用
图像信息, 并且在摄像设备产生移动时, 特别是车载摄像设备, 由于小目标检测处理过程
中, 具有短暂的延迟, 容易产生位置信息差, 为此, 特提出一种面向高清图像的目标检测算
法改进方法, 提高小目标检测精确度的同时, 有效避免了车载摄像设备移动过程中信息差说 明 书 1/6 页
3
CN 114663723 A
3
专利 一种面向高清图像的目标检测算法改进方法
文档预览
中文文档
11 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 01:19:53上传分享