专利 一种误报检测方法、装置及电子设备

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210775095.9 (22)申请日 2022.07.01 (71)申请人杭州海康威视数字技术股份有限公司地址 310051 浙江省杭州市滨江区阡陌路 555号 (72)发明人邹紫盛　 (74)专利代理机构北京博思佳知识产权代理有限公司 1 1415 专利代理师杨春香 (51)Int.Cl. G06V 20/52(2022.01) G06V 40/70(2022.01) G06V 10/774(2022.01) (54)发明名称一种误报检测方法、装置及电子设备 (57)摘要本申请提供了一种误报检测方法、装置及电子设备。本申请可以基于原始误报图像生成多个与其具有相同误报对象的扩展误报图像，从而利用原始误报图像和上述多个扩展误报图像对误报检测模型进行训练升级，使用训练后的模型对周界监控系统输出的报警图像进行误报检测，减少误报情况的发生次数。其中，具体是基于用于描述原始误报图像中的误报对象的原始描述文本确定多个扩展描述文本，并将上述多个扩展描述文本输入至已训练的多模态模型以生成与扩展描述文本一一匹配的多个扩展误报图像，从而显著增加了误报检测模型的训练样本数量，使得周界监控系统能够基于现场获取的误报数据进行模型训练，提升了误报检测的针对性与准确率。权利要求书2页说明书11页附图2页 CN 115187926 A 2022.10.14 CN 115187926 A 1.一种误报检测方法，其特征在于，所述方法包括：获取原始误报图像、用于描述所述原始误报图像中的误报对象的原始描述文本，基于所述原始描述文本确定与所述误报对象对应的多个扩展描述文本；将所述多个扩展描述文本输入至已训练的多模态模型，得到与所述多个扩展描述文本对应的多个扩展误报图像，每个扩展误报图像均包括所述误报对象；基于所述原始误报图像和所述多个扩展误报图像对原始误报检测模型进行训练，得到已训练的目标误报检测模型；其中，所述目标误报检测模型用于对待检测图像进行误报检测。 2.根据权利要求1所述的方法，其特征在于，所述原始描述文本包括所述误报对象的种类，所述扩展描述文本也包括所述误报对象的种类；所述基于所述原始描述文本确定与所述误报对象对应的多个扩展描述文本，包括：在所述原始描述文本的所述误报对象的种类前面增加新描述语，将修改后的原始描述文本作为扩展描述文本；和/或，将所述原始描述文本的所述误报对象的种类前面的描述语替换为新描述语，将修改后的原始描述文本作为扩展描述文本；其中，所述新描述语是从已生成的描述语集合中选择的。 3.根据权利要求2所述的方法，其特征在于，所述原始误报图像是针对目标场景的图像，所述原始描述文本还包括针对所述目标场景的场景描述语，所述多个扩展描述文本还包括针对所述目标场景的场景描述语。 4.根据权利要求2所述的方法，其特征在于，所述新描述语用于表示以下至少一种：所述误报对象的颜色、姿态、材质、观察视角。 5.根据权利要求2所述的方法，其特征在于，所述多模态模型的训练过程包括：获取训练图像、用于描述所述训练图像中的标定对象的训练描述文本，所述训练描述文本包括所述标定对象的种类以及所述标定对象的样本描述语；基于所述训练图像和所述训练描述文本训练得到所述多模态模型，所述多模态模型用于拟合训练图像和训练描述文本之间的关系。 6.根据权利要求5所述的方法，其特征在于，所述方法还包括：基于所述训练描述文本中的样本描述语生成所述描述语集合。 7.根据权利要求1所述的方法，其特征在于，所述基于所述原始误报图像和所述多个扩展误报图像对原始误报检测模型进行训练，得到已训练的目标误报检测模型之后，所述方法还包括：将待检测图像输入给所述目标误报检测模型，得到所述待检测图像的误报识别结果；其中，所述误报识别结果表示由所述目标误报检测模型确定的所述待检测图像是误报图像还是非误报图像；若所述误报识别结果表示所述待检测图像是非误报图像，则基于所述待检测图像更新原始误报图像，并依据更新后的原始误报图像重新训练误报检测模型。 8.一种误报检测装置，其特征在于，所述装置包括：原始图像获取单元，用于获取原始误报图像和用于描述所述原始误报图像中的误报对象的原始描述文本，基于所述原始描述文本确定与所述误报对象对应的多个扩展描述文权　利　要　求　书 1/2 页 2 CN 115187926 A 2本；扩展图像生成单元，用于将所述多个扩展描述文本输入至已训练的多模态模型，得到与所述多个扩展描述文本对应的多个扩展误报图像，每个扩展误报图像均包括所述误报对象；检测模型训练单元，用于基于所述原始误报图像和所述多个扩展误报图像对原始误报检测模型进行训练，得到已训练的目标误报检测模型；其中，所述目标误报检测模型用于对待检测图像进行误报检测。 9.根据权利要求8所述的装置，其特征在于，其中，所述原始图像获取单元中的所述原始描述文本包括所述误报对象的种类，所述扩展描述文本也包括所述误报对象的种类；所述原始图像获取单元基于所述原始描述文本确定与所述误报对象对应的多个扩展描述文本时，具体用于：在所述原始描述文本的所述误报对象的种类前面增加新描述语，将修改后的原始描述文本作为扩展描述文本；和/或，将所述原始描述文本的所述误报对象的种类前面的描述语替换为新描述语，将修改后的原始描述文本作为扩展描述文本；其中，所述新描述语是从已生成的描述语集合中选择的；其中，所述原始图像获取单元中的所述原始误报图像是针对目标场景的图像，所述原始描述文本还包括针对所述目标场景的场景描述语，所述多个扩展描述文本还包括针对所述目标场景的场景描述语；其中，所述原始图像获取单元中的所述新描述语用于表示以下至少一种：所述误报对象的颜色、姿态、材质、观察视角；其中，所述扩展图像生成单元中的所述多模态模型的训练过程包括：获取训练图像、用于描述所述训练图像中的标定对象的训练描述文本，所述训练描述文本包括所述标定对象的种类以及所述标定对象的样本描述语；基于所述训练图像和所述训练描述文本训练得到所述多模态模型，所述多模态模型用于拟合训练图像和训练描述文本之间的关系；其中，所述检测模型训练单元还用于：基于所述训练描述文本中的样本描述语生成所述描述语集合；其中，所述检测模型训练单元基于所述原始误报图像和所述多个扩展误报图像对原始误报检测模型进行训练，得到已训练的目标误报检测模型之后，还用于：将待检测图像输入给所述目标误报检测模型，得到所述待检测图像的误报识别结果；其中，所述误报识别结果表示由所述目标误报检测模型确定的所述待检测图像是误报图像还是非误报图像；若所述误报识别结果表示所述待检测图像是非误报图像，则基于所述待检测图像更新原始误报图像，并依据更新后的原始误报图像重新训练误报检测模型。 10.一种电子设备，其特征在于，该电子设备包括：处理器和机器可读存储介质；所述机器可读存储介质存储有能够被所述处理器执行的机器可执行指令；所述处理器用于执行机器可执行指令，以实现权利要求1 ‑7任一项所述的方法步骤。权　利　要　求　书 2/2 页 3 CN 115187926 A 3

专利 一种误报检测方法、装置及电子设备

专利一种误报检测方法、装置及电子设备