iso file download
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210277736.8 (22)申请日 2022.03.21 (71)申请人 北京金山云网络技 术有限公司 地址 100085 北京市海淀区西二 旗中路33 号院4号楼6层0 06号 (72)发明人 刘弘也 苏驰 李凯 王育林  (74)专利代理 机构 北京唯智勤实知识产权代理 事务所(普通 合伙) 11557 专利代理师 史立状 (51)Int.Cl. G06V 20/52(2022.01) G06K 9/62(2022.01) G06V 20/40(2022.01) G06V 10/764(2022.01) G06V 10/80(2022.01)G06V 10/84(2022.01) G06V 10/774(2022.01) (54)发明名称 图像人群计数方法、 模 型训练方法、 装置、 设 备和介质 (57)摘要 本公开的实施例公开了图像人群计数方法、 模型训练方法、 装置、 设备和介质。 该方法的一具 体实施方式包括: 获取待计数图像; 将待计数图 像输入预先训练的图像人群计数模 型, 得到待计 数图像对应的人数, 其中, 图像人群计数模型包 括特征提取网络、 多个计数子网络和融合网络, 每个计数子网络与一个人数区间对应, 融合网络 用于根据各个计数子网络的计数输出结果, 生成 待计数图像对应的人数。 该实施方式提高了图像 人群计数结果的精度。 权利要求书3页 说明书25页 附图7页 CN 114648728 A 2022.06.21 CN 114648728 A 1.一种图像人群 计数方法, 包括: 获取待计数图像; 将所述待计数图像输入预先训练的图像人群计数模型, 得到所述待计数图像对应的人 数, 其中, 所述图像人群计数模型包括特征提取网络、 多个计数子网络和融合网络, 每个计 数子网络与一个人数区间对应, 所述融合网络用于根据各个计数子网络的计数输出结果, 生成所述待计数图像对应的人 数。 2.根据权利要求1所述的方法, 其中, 所述图像人群计数模型还包括分类子网络, 所述 分类子网络用于生成分类结果; 以及所述融合网络用于根据所述各个计数子网络的计数输 出结果和所述分类结果, 生成所述待计数图像对应的人 数。 3.根据权利要求2所述的方法, 其中, 所述图像人群计数模型是通过样本集和多个样本 子集训练得到的, 所述样本集中的样本包括样本图像和所述样本图像的人数标签, 所述多 个样本子集是按照所述样本集中的各个样本图像的人数标签对应的人数区间, 对所述样本 集进行划分得到的。 4.根据权利要求3所述的方法, 其中, 所述图像人群计数模型是通过以下步骤训练得到 的: 从所述样本集中选取样本; 将所选取的样本的样本图像输入所述特 征提取网络, 得到第一图像特 征信息; 将所述第一图像特 征信息输入所述分类子网络, 得到分类结果; 将所述分类结果输入 归一化指数函数中, 得到分类概 率分布向量; 基于所述分类概率分布向量和所选取的样本的样本图像的子集标签, 确定分类损失 值; 基于所述分类损失值调整所述特 征提取网络和所述分类子网络的参数; 响应于满足训练结束条件, 将调 整参数后的特征提取网络和调整参数后的分类子网络 确定为训练后的特 征提取网络和训练后的分类子网络 。 5.根据权利要求4所述的方法, 其中, 所述图像人群计数模型是通过以下步骤训练得到 的: 对于所述多个计数子网络中的每个计数子网络, 基于所述计数子网络对应的样本子 集, 训练所述计数子网络 。 6.根据权利要求5所述的方法, 其中, 所述对于所述多个计数子网络 中的每个计数子网 络, 基于所述计数子网络对应的样本 子集, 训练所述计数子网络: 从所述计数子网络对应的样本 子集中选取样本; 将所选取的样本的样本图像输入所述训练后的特征提取网络, 得到第二图像特征信 息; 将所述第二图像特 征信息输入所述计数子网络, 得到计数 结果; 基于所述计数结果和所选取的样本的样本图像的人数标签之间的差异, 确定计数损失 值; 基于所述计数损失值调整所述计数子网络的参数; 响应于满足训练结束条件, 将调整参数后的计数子网络确定为训练后的计数子网络 。 7.根据权利要求6所述的方法, 其中, 所述图像人群计数模型是通过以下步骤训练得到权 利 要 求 书 1/3 页 2 CN 114648728 A 2的: 从所述样本集中选取样本; 将所选取的样本的样本图像输入所述训练后的特征提取网络, 得到第三图像特征信 息; 将所述第三图像特征信息分别输入所述训练后的分类子网络和多个所述训练后的计 数子网络, 得到每个训练后的计数子网络的计数输出结果和训练后的分类子网络的分类输 出结果; 将所述分类输出 结果输入所述归一 化指数函数中, 得到融合 概率分布向量; 基于所述融合概率分布向量和所述每个训练后的计数子网络的计数输出结果, 确定所 述融合网络的融合输出 结果; 基于所述融合输出 结果和所选取的样本的样本图像的人 数标签, 确定融合损失值; 基于所述融合损失值调整所述训练后的特征提取网络、 多个所述训练后的计数子网 络、 所述融合网络和所述训练后的分类子网络的参数; 响应于满足训练结束条件, 将调整参数后的所述训练后的特征提取网络、 多个调整参 数后的所述训练后的计数子网络、 调整参数后的所述融合网络和调整参数后的所述训练后 的分类子网络确定为训练完成的特征提取网络、 多个训练完成的计数子网络、 训练完成的 融合网络和训练完成的分类子网络; 将所述训练完成的特征提取网络、 所述多个训练完成的计数子网络、 所述训练完成的 融合网络和所述训练完成的分类子网络确定为所述图像人群 计数模型。 8.一种图像人群 计数模型训练方法, 包括: 获取样本集, 其中, 所述样本集中的样本包括样本图像和所述样本图像的人 数标签; 按照所述样本集中各个样本的样本图像的人数标签对应的人数区间, 对所述样本集进 行划分, 得到多个样本 子集; 获取初始图像人群计数模型, 其中, 所述初始图像人群计数模型包括特征提取网络、 多 个计数子网络和融合网络, 每 个计数子网络与一个样本 子集对应; 基于所述多个样本子集, 训练所述特征提取网络、 所述多个计数子网络和所述融合网 络, 得到所述图像人群 计数模型。 9.一种图像人群 计数装置, 包括: 获取单元, 被配置成获取待计数图像; 图像计数单元, 被配置成将所述待计数图像输入预先训练的图像人群计数模型, 得到 所述待计数图像对应的人数, 其中, 所述图像人群计数模型包括特征提取网络、 多个计数子 网络和融合网络, 每个计数子网络与一个人数区间对应, 所述融合网络用于根据各个计数 子网络的计数输出 结果, 生成所述待计数图像对应的人 数。 10.一种图像人群 计数模型训练装置, 包括: 获取样本集单元, 被配置成获取样本集, 其中, 所述样本集中的样本包括样本图像和所 述样本图像的人 数标签; 划分单元, 被配置成按照所述样本集中各个样本的样本图像的人数标签对应的人数区 间, 对所述样本集进行划分, 得到多个样本 子集; 获取初始模型单元, 被配置成获取初始图像人群计数模型, 其中, 所述初始图像人群计权 利 要 求 书 2/3 页 3 CN 114648728 A 3

.PDF文档 专利 图像人群计数方法、模型训练方法、装置、设备和介质

文档预览
中文文档 36 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共36页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 图像人群计数方法、模型训练方法、装置、设备和介质 第 1 页 专利 图像人群计数方法、模型训练方法、装置、设备和介质 第 2 页 专利 图像人群计数方法、模型训练方法、装置、设备和介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 01:20:16上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。