(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210775095.9
(22)申请日 2022.07.01
(71)申请人 杭州海康威视数字技 术股份有限公
司
地址 310051 浙江省杭州市滨江区阡 陌路
555号
(72)发明人 邹紫盛
(74)专利代理 机构 北京博思佳知识产权代理有
限公司 1 1415
专利代理师 杨春香
(51)Int.Cl.
G06V 20/52(2022.01)
G06V 40/70(2022.01)
G06V 10/774(2022.01)
(54)发明名称
一种误报检测方法、 装置及电子设备
(57)摘要
本申请提供了一种误报检测方法、 装置及电
子设备。 本申请可以基于原始误报图像生成多个
与其具有相同误报对象 的扩展误报图像, 从而利
用原始误报图像和上述多个扩展误报图像对误
报检测模型进行训练升级, 使用训练后的模型对
周界监控系统输出的报警图像进行误报检测, 减
少误报情况的发生次数。 其中, 具体是基于用于
描述原始误报图像中的误报对象的原始描述文
本确定多个扩展描述文本, 并将上述多个扩展描
述文本输入至已训练的多模态模型以生成与扩
展描述文本一一匹配的多个扩展误报图像, 从而
显著增加了误报检测模型的训练样 本数量, 使 得
周界监控系统能够基于现场获取的误报数据进
行模型训练, 提升了误报检测的针对性与准确
率。
权利要求书2页 说明书11页 附图2页
CN 115187926 A
2022.10.14
CN 115187926 A
1.一种误报检测方法, 其特 征在于, 所述方法包括:
获取原始误报图像、 用于描述所述原始误报图像中的误报对象的原始描述文本, 基于
所述原始描述文本确定与所述 误报对象对应的多个扩展 描述文本;
将所述多个扩展描述文本输入至已训练的多模态模型, 得到与 所述多个扩展描述文本
对应的多个扩展误报图像, 每 个扩展误报图像均包括所述 误报对象;
基于所述原始误报图像和所述多个扩展误报图像对原始误报检测模型进行训练, 得到
已训练的目标误报检测模型;
其中, 所述目标误报检测模型用于对待检测图像进行误报检测。
2.根据权利要求1所述的方法, 其特征在于, 所述原始描述文本包括所述误报对象的种
类, 所述扩展描述文本也包括所述误报对 象的种类; 所述基于所述原始描述文本确定与所
述误报对象对应的多个扩展 描述文本, 包括:
在所述原始描述文本的所述误报对象的种类前面增加新描述语, 将修改后的原始描述
文本作为扩展 描述文本; 和/或,
将所述原始描述文本的所述误报对象的种类前面的描述语替换为新描述语, 将修改后
的原始描述文本作为扩展 描述文本;
其中, 所述 新描述语是从已生成的描述语集 合中选择的。
3.根据权利要求2所述的方法, 其特征在于, 所述原始误报图像是针对目标场景的图
像, 所述原始描述文本还包括针对所述 目标场景 的场景描述语, 所述多个扩展描述文本还
包括针对所述目标场景的场景描述语。
4.根据权利要求2所述的方法, 其特征在于, 所述新描述语用于表示以下至少一种: 所
述误报对象的颜色、 姿态、 材质、 观察视角。
5.根据权利要求2所述的方法, 其特 征在于, 所述多模态模型的训练过程包括:
获取训练图像、 用于描述所述训练图像中的标定对象的训练描述文本, 所述训练描述
文本包括所述标定对象的种类以及所述标定对象的样本描述语;
基于所述训练图像和所述训练描述文本训练得到所述多模态模型, 所述多模态模型用
于拟合训练图像和训练描述文本之间的关系。
6.根据权利要求5所述的方法, 其特 征在于, 所述方法还 包括:
基于所述训练描述文本中的样本描述语生成所述描述语集 合。
7.根据权利要求1所述的方法, 其特征在于, 所述基于所述原始误报图像和所述多个扩
展误报图像对原始误报检测模型进行训练, 得到已训练的目标误报检测模型之后, 所述方
法还包括:
将待检测图像输入给所述目标误报检测模型, 得到所述待检测图像的误报识别结果;
其中, 所述误报识别结果表示由所述目标误报检测模型确定的所述待检测图像是误报图像
还是非误报图像;
若所述误报识别结果表示所述待检测图像是非误报图像, 则 基于所述待检测图像更新
原始误报图像, 并依据更新后的原 始误报图像重新训练误报检测模型。
8.一种误报检测装置, 其特 征在于, 所述装置包括:
原始图像获取单元, 用于获取原始误报图像和用于描述所述原始误报图像中的误报对
象的原始描述文本, 基于所述原始描述文本确定与所述误报对象对应的多个扩展描述文权 利 要 求 书 1/2 页
2
CN 115187926 A
2本;
扩展图像生成单元, 用于将所述多个扩展描述文本输入至已训练的多模态模型, 得到
与所述多个扩展描述文本对应的多个扩展误报图像, 每个扩展误报图像均包括所述误报对
象;
检测模型训练单元, 用于基于所述原始误报图像和所述多个扩展误报图像对原始误报
检测模型进 行训练, 得到已训练的目标误报 检测模型; 其中, 所述目标误报 检测模型用于对
待检测图像进行误报检测。
9.根据权利要求8所述的装置, 其特 征在于,
其中, 所述原始图像获取单元中的所述原始描述文本包括所述误报对象的种类, 所述
扩展描述文本也包括所述误报对象的种类; 所述原始图像获取单元基于所述原始描述文本
确定与所述误报对 象对应的多个扩展描述文本时, 具体用于: 在所述原始描述文本的所述
误报对象的种类前面增加 新描述语, 将修改后的原始描述文本作为扩展描述文本; 和/或,
将所述原始描述文本的所述误报对象的种类前面的描述语替换为新描述语, 将修改后的原
始描述文本作为扩展 描述文本; 其中, 所述 新描述语是从已生成的描述语集 合中选择的;
其中, 所述原始图像获取单元中的所述原始误报图像是针对目标场景的图像, 所述原
始描述文本还包括针对所述目标场景的场景描述语, 所述多个扩展描述文本还包括针对所
述目标场景的场景描述语;
其中, 所述原始图像获取单元中的所述新描述语用于表示以下至少一种: 所述误报对
象的颜色、 姿态、 材质、 观察视角;
其中, 所述扩展图像生成单元中的所述多模态模型的训练过程包括: 获取训练图像、 用
于描述所述训练图像中的标定对象的训练描述文本, 所述训练描述文本包括所述标定对象
的种类以及所述标定对象的样本描述语; 基于所述训练图像和所述训练描述文本训练得到
所述多模态模型, 所述多模态模型用于拟合训练图像和训练描述文本之间的关系;
其中, 所述检测模型训练单元还用于: 基于所述训练描述文本中的样本描述语生成所
述描述语集 合;
其中, 所述检测模型训练单元基于所述原始误报图像和所述多个扩展误报图像对原始
误报检测模型进行训练, 得到已训练的目标误报 检测模型之后, 还用于: 将待检测图像输入
给所述目标误报 检测模型, 得到所述待检测图像的误报识别结果; 其中, 所述误报识别结果
表示由所述目标误报 检测模型确定的所述待检测图像是误报图像还是非误报图像; 若 所述
误报识别结果表示所述待检测图像是非误报图像, 则基于所述待检测图像更新原始 误报图
像, 并依据更新后的原 始误报图像重新训练误报检测模型。
10.一种电子设备, 其特 征在于, 该电子设备包括: 处 理器和机器可读存 储介质;
所述机器可读存 储介质存 储有能够被所述处 理器执行的机器可 执行指令;
所述处理器用于执 行机器可 执行指令, 以实现权利要求1 ‑7任一项所述的方法步骤。权 利 要 求 书 2/2 页
3
CN 115187926 A
3
专利 一种误报检测方法、装置及电子设备
文档预览
中文文档
16 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-03-03 12:17:23上传分享