iso file download
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210742273.8 (22)申请日 2022.06.27 (71)申请人 长沙理工大 学 地址 410114 湖南省长 沙市天心区万家丽 路二段96 0号 (72)发明人 池贤铖 徐蔚鸿  (51)Int.Cl. G06V 10/764(2022.01) G06V 10/82(2022.01) G06T 7/73(2017.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种基于全通道空间定位注意力机制的实 时目标检测方法 (57)摘要 本发明公开一种基于全通道空间定位注意 力机制的实时目标检测算法。 包括: 对压缩激励 模块SE进行改进, 提出了全通道空间定位注意力 机制ACSP, 通过显式建模 通道间的相关性和保留 空间定位效果, 实现了有效信息的保留和噪声信 息的抑制。 对YOLOX ‑s进行操作改进, 提出了 SPSENet目标检测模型。 在CSPDarknet中的CBS前 添加ACSP, 能够降低特征图下采样后的特征信息 丢失。 在PAFPN中的CBS和Upsample后添加ACSP, 能够更好的进行特征融合, 能够实现对有效信息 的保留和噪声信息的抑制。 采用交通标志检测数 据集GTSDB训练SPSENet, 训练集中样本为包含待 检测目标的图片, 标签为图片中目标的位置和类 别, 得到训练好的检测模型; 将测试集的图片输 入到训练好的检测模型中, 得到图片中目标的位 置和类别。 权利要求书1页 说明书5页 附图3页 CN 115082737 A 2022.09.20 CN 115082737 A 1.一种基于全通道空间定位注意力机制的实时目标检测方法, 其特征在于, 该方法包 括: 采用目标检测数据集训练SPSENet, 训练集中样本为待检测目标的图片, 标签为图片中 目标所在的位置和类别信息, 得到训练好的检测模型; 将测试集的图片输入到训练好的检 测模型中, 得到图片中目标的位置和类别。 所述SPSENet包括串联的CSPDarknet、 PA FPN和Yolo‑head。 CSPDarknet包括Focu s、 CBS、 CSP_X和SPP, 其中Focus表 示对图像进行切片操作。 CBS表 示卷积和批量归一化操作, 激活函 数是SiLU。 CSP_ X(X表示Res_Unit的堆叠个 数)包括CBS、 Concatenation、 Res_U nit(包括CBS 和Add)和ACSP。 PAFPN包括CBS、 Upsample、 CSP2_1(包括CBS和Concatenation)和 Concatenati on。 Yolo‑head包括CBS、 Co nv和Concatenati on。 2.如权利要求1所述方法, 其特 征在于, 全通道空间定位ACS P的结构包括: 输入特征图分别进行全局平均池化和通道维度上的最大池化, 得到两个特征矩阵。 全 局平均池化得到的特征矩阵经过Squeeze操作和Excitation操作得到新的特征矩阵V3。 通 道维度上最大池化得到的特征矩阵输入到卷积层, 卷积层中卷积核个数和输入特征图的通 道个数一致, 卷积层输出特征矩阵L, 将V3与L进行加权得到权重矩阵, 权重矩阵与输入 特征 图加权得到加权特 征图。 3.如权利要求1所述方法, 其特 征在于, 新的实时性目标检测模型S PSENet的改进包括: 将ACSP插入到CSPDarknet中的CBS前, 调整ACSP模块中卷积核的个数以适应不同的 CSP_X模块。 在PAFPN中的CBS和Upsample后添加ACSP, 调整ACSP 模块中卷积核的个数以适应 不同的Concatenation和Upsample。 调整CSPDarknet中CSP_X的Res_U nit堆叠个 数, 将dark3 和dark4中的CSP_3调整为CS P_1。 4.如权利要求1所述方法, 其特征在于, 训练SPSENet模型: 根据ACSP和SPSENet的结构, 修改训练模型的网络结构部分, 训练得到一个实时的目标检测模型。权 利 要 求 书 1/1 页 2 CN 115082737 A 2一种基于全通道空间定位注意力机制的实时目标 检测方法 技术领域 [0001]本发明属于目标检测技术领域, 尤其涉及 一种基于全通道空间定位注意力机制的 实时目标检测方法。 背景技术 [0002]目标检测是一类重要的计算机视觉任务, 目标是开发计算模型和技术, 提供计算 机视觉应用程序所需的最基本的信息之一: 什么目标在哪里? 从应用程序的角度来看, 目标 检测可以被分为 “通用目标检测 ”和“特定目标检测 ”两个研究主题, 前者旨在探索在统一的 框架下检测不同类型物体的方法, 以模拟人类的视觉和认知; 后者是指特定应用场景下 的 检测, 如车辆检测、 行人检测、 人脸检测等。 近年来, 随着深度学习技术的快速发展, 为目标 检测注入了新的血 液, 取得了显著的突破, 将其推向了一个前 所未有的研究热点。 [0003]基于深度学习的目标检测可以分为两大类: 两阶段检测和一阶段检测。 前者将目 标检测流程分为两部分, 生成候选框和识别框内物体的过程。 典型 的两阶段检测 器包括R‑ CNN、 SPPNet、 Fast  R‑CNN、 FasterR ‑CNN和Mask  R‑CNN等。 后者将 整个流程统一在一起, 直接 给出检测结果。 典型的单阶段检测器包括YOLO系 列、 SSD和RetinaNet等。 两级检测器和一级 检测器都有复杂的网络结构和大量的参数, 需要GPU(图形处理单元)进 行实时目标检测。 但 在实际应用中, 设备的计算能力和内存 是有限的。 因此, 人们提出了许多轻量级的目标检测 方法。 [0004]轻量级目标检测方法具有更简单的网络结构和更少的参数, 能满足实际应用中计 算能力和内存有限的设备对实时检测的要求。 [0005]然而, 现有的轻量级 目标检测算法准确率不够高, 漏检、 误检多, 不能达到实时检 测所要求的精度。 其重要原因之一, 是检测过程对检测对象的特征提取效果欠精准。 为此, 模型中引入恰当的注意力机制有望进一 步解决以上问题。 [0006]典型的注意力机制包括SE、 SAM、 GAM和CBAM等。 其中通道注意力机制SE被广泛使 用, 通过Squeeze和Excitation操作, 能显式地对通道 间的相关性进行建模。 但是SE有个明 显的缺陷, 就是它忽略了目标空间定位的重要性和作用。 发明内容 [0007]针对现有技术的缺陷和改进需求, 本发明提供了一种基于全通道空间定位注意力 机制的实时目标检测 算法, 其目的在于保证实时性和 参数量的前提下, 提高模型对检测物 体的精确度和泛化能力。 [0008]为实现上述目的, 按照本发明的第一方面, 提供了一种基于全通道空间定位注意 力机制ACS P, 包括以下步骤: [0009]输入特征图分别进行全局平均池化和通道维度上的最大池化, 得到两个特征矩 阵, 全局平均池化得到的特征矩阵进行Squeeze和Excitation操作得到新的特征矩阵V3, 通 道维度上最大池化得到的特征矩阵输入到卷积层中, 卷积层中卷积核个数和输入特征图的说 明 书 1/5 页 3 CN 115082737 A 3

.PDF文档 专利 一种基于全通道空间定位注意力机制的实时目标检测方法

文档预览
中文文档 10 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于全通道空间定位注意力机制的实时目标检测方法 第 1 页 专利 一种基于全通道空间定位注意力机制的实时目标检测方法 第 2 页 专利 一种基于全通道空间定位注意力机制的实时目标检测方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 09:46:59上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。