iso file download
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210810694.X (22)申请日 2022.07.11 (71)申请人 上海商汤智能科技有限公司 地址 200233 上海市徐汇区桂平路391号3 号楼1605A室 (72)发明人 李钢 王宇杰  (74)专利代理 机构 北京中知恒瑞知识产权代理 事务所(普通 合伙) 11889 专利代理师 尹礼 (51)Int.Cl. G06V 10/25(2022.01) G06V 10/774(2022.01) G06V 20/52(2022.01) G06V 40/10(2022.01) G06N 20/00(2019.01) (54)发明名称 目标检测网络的训练及目标检测方法、 装置 及设备 (57)摘要 本公开提供了一种目标检测网络的训练及 目标检测方法、 装置及设备, 该训练方法包括: 获 取已标注训练图像样本集和未标注训练图像样 本集; 分别将各已标注训练图像样 本输入学生网 络中进行训练, 确定第一损失函数; 分别将各未 标注训练图像样本输入教师网络中, 获得第一目 标检测行为信息; 根据各未标注训练图像样本和 第一目标检测行为信息, 训练所述学生网络, 获 得第二目标检测行为信息, 确定第二损失函数, 并根据所述第一损失函数和所述第二损失函数 确定目标损失函数, 在迭代训练次数达到阈值或 者所述目标损失函数满足预设收敛条件的情况 下, 获得目标检测网络 。 权利要求书3页 说明书19页 附图4页 CN 115187772 A 2022.10.14 CN 115187772 A 1.一种目标检测网络的训练方法, 其特 征在于, 包括: 获取已标注训练图像样本集和未 标注训练图像样本集; 分别将所述已标注训练图像样本集中各已标注训练图像样本输入学生网络中进行训 练, 确定第一损失函数, 其中, 所述第一损失函数为所述学生网络识别出的类别与已标注训 练图像样本的已标注类别之间的损失函数; 分别将所述未标注训练图像样本集中各未标注训练图像样本输入教师网络 中, 获得对 所述各未标注训练图像样本的第一目标检测行为信息; 根据所述各未标注训练图像样本和所述第一目标检测行为信息, 训练所述学生网络, 获得对所述各未标注训练图像样本的第二 目标检测行为信息, 确定第二损失函数, 并根据 所述第一损失函数和所述第二损失函数确定目标损失函数, 在 迭代训练 次数达到阈值或者 所述目标损失函数满足预设收敛条件的情况下, 获得目标检测网络, 其中, 所述第二损失函 数为所述第二目标检测行为信息与所述第一目标检测行为信息之间的损失函数。 2.根据权利要求1所述的方法, 其特征在于, 在所述第 一目标检测行为信 息中识别出的 多个第一候选框被聚类为多个簇情况下, 则根据所述第一损失函数和所述第二损失函数确 定目标损失函数, 包括: 针对所述多个簇中的每 个簇, 得到所述簇对应的第二损失函数; 基于得到的多个第二损失函数的加权平均, 得到第三损失函数; 根据所述第三损失函数和所述第一损失函数, 得到所述目标损失函数。 3.根据权利要求2所述的方法, 其特征在于, 针对所述多个簇中的每个簇, 得到所述簇 对应的第二损失函数, 包括: 分别针对所述多个簇中每个簇, 基于所述学生网络识别出目标的各第二候选框的类 别, 与所述教师网络识别出 的置信度最高的第一候选框的类别 之间的损失函数, 获得类别 损失函数; 基于所述学生网络识别出目标的各第 二候选框, 与所述教师网络识别出的置信度最高 的第一候选框之间的损失函数, 获得回归损失函数; 基于所述学生网络识别出目标的各第 二候选框排序分布, 与 所述教师网络识别出的各 第一候选框排序分布之间的损失函数, 获得排序分布损失函数; 根据所述类别损 失函数、 所述回归损 失函数和所述排序分布损 失函数, 确定所述第二 损失函数。 4.根据权利要求3所述的方法, 其特征在于, 根据所述类别损 失函数、 所述回归损 失函 数和所述 排序分布损失函数, 确定所述第二损失函数, 包括: 获得所述类别损失函数和所述 回归损失函数之间的加和, 并获得所述排序分布损失函 数与第一权重值之间的乘积, 将所述加和以及所述乘积相加, 作为所述第二损失函数, 其 中, 所述第一权 重值用于控制排序分布所占损失权 重。 5.根据权利要求1至4任一项所述的方法, 其特征在于, 在迭代训练次数达到阈值或者 所述目标损失函数满足预设收敛 条件的情况 下, 所述获得 所述目标检测网络, 包括: 针对当前次数的迭代训练, 根据所述各已标注训练图像样本, 以及根据所述各未标注 训练图像样本和所述第一 目标检测行为信息, 训练所述学生网络, 并根据所述当前次数迭 代训练获得的学生网络的模型参数, 确定下一次迭代训练的教师网络的模型参数, 直至所权 利 要 求 书 1/3 页 2 CN 115187772 A 2述迭代训练次数达 到阈值或所述目标损失函数收敛, 获得 所述目标检测网络 。 6.根据权利要求5所述的方法, 其特 征在于, 所述获得 所述目标检测网络, 包括: 将所述迭代训练次数达到阈值或者所述目标损失函数收敛时获得的所述教师网络或 所述学生网络, 作为所述目标检测网络 。 7.一种目标检测方法, 其特 征在于, 包括: 获取待检测图像; 利用基于权利要求1至6任一项基于所述的目标检测网络的训练方法生成的已训练的 目标检测网络, 对所述待检测图像进行目标检测, 获得从所述待检测图像中检测到的目标 的类别。 8.根据权利要求7所述的方法, 其特征在于, 所述待检测图像为监控设备拍摄到的待检 测监控图像, 则获得从所述待检测图像中检测到的目标的类别, 包括: 利用所述目标检测网络, 对所述待检测监控图像中人体进行目标检测, 确定所述待检 测监控图像中是否存在人体, 并在确定存在人体情况 下, 确定所 人体是否为目标用户。 9.根据权利要求7所述的方法, 其特征在于, 所述待检测图像为设定路段的待检测交通 图像, 则获得从所述待检测图像中检测到的目标的类别, 包括: 利用所述目标检测网络, 对所述待检测 交通图像进行目标检测, 确定所述待检测 交通 图像中属于车辆类别的目标, 并确定属于车辆类别的目标 数量; 根据确定的属于车辆类别的目标 数量, 获得 所设定路段的交通拥堵等级。 10.一种目标检测网络的训练装置, 其特 征在于, 包括: 第一获取模块, 用于获取已标注训练图像样本集和未 标注训练图像样本集; 第一训练分支模块, 用于分别将所述已标注训练图像样本集中各已标注训练图像样本 输入学生网络中进 行训练, 确定第一损失函数, 其中, 所述第一损失函数为所述学生网络识 别出的类别与已标注训练图像样本的已标注类别之间的损失函数; 第二训练分支模块, 用于分别将所述未标注训练图像样本集中各未标注训练图像样本 输入教师网络中, 获得对所述各未标注训练图像样本的第一 目标检测行为信息; 根据所述 各未标注训练图像样本和所述第一 目标检测行为信息, 训练所述学生网络, 获得对所述各 未标注训练图像样本的第二 目标检测行为信息, 确定第二损失函数, 并根据所述第一损失 函数和所述第二损失函数确定目标损失函数, 在迭代训练次数达到阈值或者所述目标损失 函数满足预设收敛条件的情况下, 获得目标检测网络, 其中, 所述第二损失函数为所述第二 目标检测行为信息与所述第一目标检测行为信息之间的损失函数。 11.一种目标检测装置, 其特 征在于, 包括: 第二获取模块, 用于获取待检测图像; 检测模块, 用于利用基于权利要求1至6任一项所述的目标检测网络的训练方法生成的 目标检测网络, 对所述待检测图像进行目标检测, 获得从所述待检测图像中检测到的目标 的类别。 12.一种计算机设备, 其特征在于, 包括: 处理器、 存储器, 所述存储器存储有所述处理 器可执行 的机器可读指令, 所述处理器用于执行所述存储器中存储的机器可读指令, 所述 机器可读指令被所述处理器执行时, 所述处理器执行如权利要求 1至6任一项 所述的目标检 测网络的训练方法, 或7至9任一项所述的目标检测方法的步骤。权 利 要 求 书 2/3 页 3 CN 115187772 A 3

PDF文档 专利 目标检测网络的训练及目标检测方法、装置及设备

文档预览
中文文档 27 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共27页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 目标检测网络的训练及目标检测方法、装置及设备 第 1 页 专利 目标检测网络的训练及目标检测方法、装置及设备 第 2 页 专利 目标检测网络的训练及目标检测方法、装置及设备 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:17:19上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。