iso file download
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210112724.X (22)申请日 2022.01.29 (71)申请人 上海商汤智能科技有限公司 地址 200233 上海市徐汇区桂平路391号3 号楼1605A室 (72)发明人 杨昆霖 刘诗男 侯军 伊帅 (74)专利代理 机构 北京林达刘知识产权代理事 务所(普通 合伙) 11277 专利代理师 刘新宇 (51)Int.Cl. G06V 10/46(2022.01) G06V 10/764(2022.01) G06V 10/80(2022.01) G06V 10/82(2022.01) G06T 7/73(2017.01)G06T 7/62(2017.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种目标对象确定方法及装置、 电子 设备和 存储介质 (57)摘要 本公开涉及一种目标对象确定方法及 装置、 电子设备和存储介质, 所述方法包括: 获取输入 特征, 所述输入 特征包括输入图像或对所述输入 图像进行至少一次卷积操作得到的特征; 获取所 述输入图像中目标对象 的尺寸信息; 基于所述尺 寸信息和所述输入特征, 确定卷积核在所述输入 特征中采样时采样点的位置偏移量; 基于所述位 置偏移量调整后的卷积核, 对所述输入特征进行 卷积操作, 得到输出特征, 所述输出特征用于确 定所述输入图像中的目标对象。 本公开实施例提 取的输出特征可准确地确定目标对象的位置和 数量等信息。 权利要求书2页 说明书23页 附图7页 CN 114511712 A 2022.05.17 CN 114511712 A 1.一种目标对象确定方法, 其特 征在于, 包括: 获取输入特征, 所述输入特征包括输入图像或对所述输入图像进行至少一 次卷积操作 得到的特 征; 获取所述输入图像中目标对象的尺寸信息; 基于所述尺寸信 息和所述输入特征, 确定卷积核在所述输入特征中采样时采样点的位 置偏移量; 基于所述位置偏移量调整后的卷积核, 对所述输入特征进行卷积操作, 得到输出特征, 所述输出 特征用于确定所述输入图像中的目标对象。 2.根据权利要求1所述方法, 其特征在于, 在存在至少两个目标对象的尺寸信 息的情况 下, 所述获取 所述输入图像中目标对象的尺寸信息, 包括: 将获取到的所述至少两个目标对象的尺寸信 息的平均值, 作为所述目标对象在所述输 入图像中的尺寸信息 。 3.根据权利要求1 ‑2所述方法, 其特征在于, 所述基于所述尺寸信息和所述输入特征, 确定卷积核在所述输入特 征中采样时采样点的位置偏移量, 包括: 将所述尺寸信息与所述输入特 征进行融合, 得到融合特 征; 基于所述融合特 征, 确定卷积核在所述输入特 征中采样时采样点的位置偏移量。 4.根据权利要求3所述方法, 其特征在于, 所述将所述尺寸信 息与所述输入特征进行融 合, 得到融合特 征, 包括: 对所述尺寸信息进行非线性变换操作, 得到表征 所述尺寸信息的尺寸特 征; 对所述输入特 征进行卷积操作, 得到卷积输入特 征; 将所述尺寸特 征与所述卷积输入特 征进行融合, 得到融合特 征。 5.根据权利要求1 ‑4任一所述方法, 其特 征在于, 所述方法还 包括: 基于所述输出 特征, 确定所述输入图像中的目标对象的数量和/或位置 。 6.根据权利要求1 ‑5任一所述方法, 其特征在于, 所述目标对象确定方法基于神经网络 实现, 所述神经网络的训练样本和/或测试样本的构建方法包括: 根据第一样本图像的标注信息, 得到目标对象的至少一个目标子图; 将所述目标子图粘贴到第 二样本图像中, 得到合成图像以及所述目标子图在所述合成 图像中的粘贴位置信息; 将所述粘贴位置信息作为 合成图像中的标注信息, 生成合成样本图像。 7.根据权利要求6所述方法, 其特征在于, 所述根据第一样本 图像的标注信息, 得到目 标对象的至少一个目标子图, 包括: 提取所述标注信息对应的目标区域中的图像, 作为目标子图; 和/或, 对所述标注信 息对应的目标区域中的图像分别进行至少一 次图像变换, 将图像变换后 的图像作为目标子图。 8.根据权利要求6或7所述方法, 其特征在于, 在根据第 一样本图像的标注信息, 得到目 标对象的至少一个目标子图前, 所述方法还 包括: 根据所述目标区域的尺寸信息, 以及所述第二样本 图像的尺寸信息, 确定要生成的目 标子图的第一数量; 其中, 所述 目标子图的第一数量与所述第二样本图像的尺寸信息正相 关、 与所述目标区域的尺寸信息负相关。权 利 要 求 书 1/2 页 2 CN 114511712 A 29.根据权利要求8所述方法, 其特征在于, 在确定要生成的目标子 图的数量后, 所述对 所述标注信息对应的目标区域中的图像分别进行至少一次图像 变换, 包括: 根据所述第一数量, 对所述目标区域中的图像分别进行至少一次图像变换, 得到所述 第一数量的目标子图; 所述图像 变换包括下述至少之一: 图像拉伸、 图像收缩、 图像选择、 图像对称变换、 在图像中添加噪声。 10.一种目标对象确定装置, 其特 征在于, 包括: 输入模块, 用于 接收输入图像, 并对输入图像进行至少一次卷积 操作, 得到 输出特征: 至少一个尺度卷积模块, 用于将上一模块的输出特征作为输入特征, 以执行权利要求 1‑4任意一项所述的方法; 目标对象确定模块, 用于基于所述至少一个尺度卷积模块的输出特征, 确定所述输入 图像中的目标对象的数量和/或位置 。 11.一种目标对象确定装置, 其特 征在于, 包括: 输入特征获取模块, 用于获取输入特征, 所述输入特征包括输入图像或对所述输入图 像进行至少一次卷积 操作得到的特 征; 尺寸信息获取模块, 用于获取 所述输入图像中目标对象的尺寸信息; 位置偏移量确定模块, 用于基于所述尺寸信息和所述输入特征, 确定卷积核在所述输 入特征中采样时采样点的位置偏移量; 卷积操作模块, 用于基于所述位置偏移量调整后的卷积核, 对所述输入特征进行卷积 操作, 得到 输出特征, 所述输出 特征用于确定所述输入图像中的目标对象。 12.一种电子设备, 其特 征在于, 包括: 处理器; 用于存储处理器可执行指令的存 储器; 其中, 所述处理器被配置为调用所述存储器存储的指令, 以执行权利要求1至9中任意 一项所述的方法。 13.一种计算机可读存储介质, 其上存储有计算机程序指令, 其特征在于, 所述计算机 程序指令被处 理器执行时实现权利要求1至9中任意 一项所述的方法。权 利 要 求 书 2/2 页 3 CN 114511712 A 3
专利 一种目标对象确定方法及装置、电子设备和存储介质
文档预览
中文文档
33 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助3元下载(无需注册)
温馨提示:本文档共33页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助3元下载
本文档由 人生无常 于
2024-03-18 01:19:03
上传分享
举报
下载
原文档
(1.1 MB)
分享
友情链接
GB-T 42807-2023 港口基础地理信息交换服务技术要求.pdf
GB-T 17713-2022 吸油烟机及其他烹饪烟气吸排装置.pdf
框架架构TOGAF学习指南.pdf
DB15-T 2186—2021 林草数据备份管理规范 内蒙古自治区.pdf
GB-T 30271-2013 信息安全技术 信息安全服务能力评估准则.pdf
GB-T 12963-2022 电子级多晶硅.pdf
GB-T 35625-2017 公共安全 业务连续性管理体系 业务影响分析指南(BIA).pdf
DB51-T 2799-2021 四川省高速公路景观及绿化设计指南 四川省.pdf
GB-T 39308-2020 难降解有机废水深度处理技术规范.pdf
DB43-T 1315-2023 森林城市评价指标 湖南省.pdf
GB-T 20008-2005 信息安全技术 操作系统安全评估准则.pdf
GB-T 4754-2017 国民经济行业分类.pdf
GB-T 10180-2017 工业锅炉热工性能试验规程.pdf
GB-T 9465-2018 高空作业车.pdf
GB-T 28827.1-2012 信息技术服务 运行维护 第1部分:通用要求.pdf
奇安信的漏洞管理实践.pdf
GB-T 3410.2-2008 大坝监测仪器 测缝计 第2部分:振弦式测缝计.pdf
T-JSDL 1—2017 高处作业吊篮施工安全管理规程.pdf
GB-T 33592-2017 分布式电源并网运行控制规范.pdf
T-CPUMT 010—2022 往复式内燃机电站设计规范.pdf
1
/
3
33
评价文档
赞助3元 点击下载(1.1 MB)
回到顶部
×
微信扫码支付
3
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。