iso file download
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210784967.8 (22)申请日 2022.06.29 (71)申请人 深圳市城市公共安全技 术研究院有 限公司 地址 518000 广东省深圳市福田区福田街 道福安社区福华一路1号深圳大中华 国际交易广场10层、 1 1层 申请人 城市安全发展科技研究院 (深圳) (72)发明人 尹继尧 周琳 陈文江  (74)专利代理 机构 北京三聚阳光知识产权代理 有限公司 1 1250 专利代理师 李博洋 (51)Int.Cl. G06V 20/40(2022.01) G06V 20/52(2022.01)G06V 10/82(2022.01) G06V 10/80(2022.01) G06V 10/764(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种检测模型的训练方法、 装置、 电子设备 及存储介质 (57)摘要 本申请公开了一种检测模型的训练方法、 装 置、 电子设备及存储介质。 包括: 首先从监控视频 中提取目标视频帧图像, 并将标注信息携带在目 标视频帧图像。 得到样本图像; 利用 样本图像训 练无锚框的深度学习网络模型, 以使深度学习网 络模型中的主干网络层从样本图像中提取图像 特征, 基于图像特征生成特征图, 通过预测层中 的解耦头基于特征图输出目标对象的预测位置 信息; 如果预测位置信息满足预设条件, 即得到 检测模型。 本申请在预测层中加入解耦头能够提 高深度学习网络模型的检测速度和精度。 同时在 训练过程中没有锚框, 所以不需要计算锚框和边 界框之间的交并比来获得样本图像。 因此可以直 接利用携带标注信息的样本图像训练模型, 提高 了模型的训练效率。 权利要求书2页 说明书8页 附图3页 CN 115049965 A 2022.09.13 CN 115049965 A 1.一种检测模型的训练方法, 其特 征在于, 包括: 获取对目标厂房进行监控得到的监控视频, 并从所述监控视频中提取多个目标视频帧 图像, 其中, 所述目标视频帧图像中包括至少一个目标对象; 将获取的标签信 息携带于所述目标视频帧图像, 得到样本图像, 其中, 所述标签信 息用 于标注所述目标对象在所述视频帧图像中的实际位置信息; 利用所述样本图像训练无锚框的深度 学习网络模型, 以使所述深度学习网络模型中的 主干网络层从所述样本图像中提取图像特征, 基于所述图像特征生成目标特征图, 将所述 目标特征图传递至预测层, 通过所述预测层基于所述 目标特征图进行预测, 得到所述 目标 对象的预测位置信息; 确定所述预测位置信 息与实际位置信 息之间的匹配度, 在所述匹配度落入预设范围的 情况下, 将所述深度学习网络模型确定为检测模型。 2.根据权利要求1所述的方法, 其特征在于, 所述从所述监控视频中提取多个目标视频 帧图像, 包括: 提取所述监控视频 所包括的视频帧图像; 检测所述视频帧图像的完整程度; 将所述完整程度满足预设完整程度的视频帧图像确定为所述目标帧图像。 3.根据权利要求1所述的方法, 其特 征在于, 所述方法还 包括: 将所述目标帧图像按照第 一预设比例生成训练集合, 以及按照第 二预设比例生成测试 集合, 其中, 所述第一预设比例大于所述第二预设比例。 4.根据权利要求3所述的方法, 其特征在于, 所述深度学习 网络模型包括: 顺次连接的 主干网络层、 瓶颈层以及预测层, 所述预测层 包括: 解耦头以及检测器, 所述解耦头包括: 分 类头、 目标头以及位置 头。 5.根据权利要求4所述的方法, 其特征在于, 所述利用所述样本图像训练无锚框的深度 学习网络模型, 以使 所述深度学习网络模型中的主干网络层从所述样本图像中提取图像特 征, 基于所述图像特征生成目标特征图, 将所述目标特征图传递至预测层, 通过所述预测层 基于所述目标 特征图进行 预测, 得到所述目标对象的预测位置信息, 包括: 将所述样本图像输入所述深度 学习网络模型, 通过所述主干网络层从所述样本图像中 提取初始图像特 征, 并将所述初始图像特 征传递至所述 瓶颈层; 通过所述瓶颈层对所述初始图像特征进行上采样处理, 得到高层图像特征, 并融合所 述高层图像特 征, 得到目标 特征图, 将所述目标 特征图传递至所述预测层; 通过所述预测层基于所述目标特征图进行预测, 得到包围所述目标对象的预测框, 并 利用所述预测框的坐标确定所述预测位置信息 。 6.根据权利要求5所述的方法, 其特征在于, 所述通过所述预测层基于所述目标特征图 进行预测, 得到包围所述 目标对象的预测框, 并利用所述预测框的坐标确定所述预测位置 信息, 包括: 通过所述预测层的分类头确定所述目标特征图中预测框的类别, 以及类别对应的类别 分数, 通过所述预测层中的目标头从所述目标特征图中获取与实际目标框相匹配的预测框 作为前景特征, 以及通过所述预测层中的位置头从所述目标特征图中得到所述预测框的初 始坐标;权 利 要 求 书 1/2 页 2 CN 115049965 A 2通过所述检测器对所述预测框对应的类别及类别分数、 前景特征以及所述预测框的初 始坐标进行融合 拼接, 得到所述预测位置信息 。 7.根据权利要求3所述的方法, 其特 征在于, 所述方法还 包括: 在所述匹配度落入预设范围的情况下, 利用所述测试集合中的目标视频帧图像对所述 深度学习网络模型进行测试, 得到测试 结果; 在所述测试结果满足预设测试结果的情况下, 将所述深度 学习网络模型确定为检测模 型。 8.一种检测模型的训练装置, 其特 征在于, 包括: 获取模块, 用于获取对目标厂房进行监控得到的监控视频, 并从所述监控视频中提取 多个目标视频帧图像, 其中, 所述目标视频帧图像中包括至少一个目标对象; 标注模块, 用于将获取的标签信息携带于所述目标视频帧图像, 得到样本图像, 其中, 所述标签信息用于标注所述目标对象在所述视频帧图像中的实际位置信息; 处理模块, 用于利用所述样本 图像训练无锚框的深度学习 网络模型, 以使所述深度学 习网络模型中的主干网络层从所述样本图像中提取图像特征, 基于所述图像特征生成目标 特征图, 将所述目标特征图传递至预测层, 通过所述预测层基于所述目标特征图进 行预测, 得到所述目标对象的预测位置信息; 确定模块, 用于确定所述预测位置信息与实 际位置信息之间的匹配度, 在所述匹配度 落入预设范围的情况 下, 将所述深度学习网络模型确定为检测模型。 9.一种存储介质, 其特征在于, 所述存储介质包括存储的程序, 其中, 所述程序运行时 执行上述权利要求1至7中任一项所述的方法步骤。 10.一种电子设备, 其特征在于, 包括处理器、 通信接口、 存储器和通信总 线, 其中, 处理 器, 通信接口, 存 储器通过通信总线完成相互间的通信; 其中: 存储器, 用于存放计算机程序; 处理器, 用于通过运行存储器上所存放的程序来执行权利要求1至7中任一项所述的方 法步骤。权 利 要 求 书 2/2 页 3 CN 115049965 A 3

.PDF文档 专利 一种检测模型的训练方法、装置、电子设备及存储介质

文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种检测模型的训练方法、装置、电子设备及存储介质 第 1 页 专利 一种检测模型的训练方法、装置、电子设备及存储介质 第 2 页 专利 一种检测模型的训练方法、装置、电子设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 06:59:29上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。