iso file download
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210147505.5 (22)申请日 2022.02.17 (71)申请人 北京深睿博 联科技有限责任公司 地址 100080 北京市海淀区海淀大街8号A 座21层A区 申请人 杭州深睿博 联科技有限公司 (72)发明人 高凯 周振 俞益洲 李一鸣 乔昕 (74)专利代理 机构 北京天方智力知识产权代理 事务所(普通 合伙) 11719 专利代理师 路远 (51)Int.Cl. G06T 7/246(2017.01) G06K 9/62(2022.01) G06V 10/80(2022.01) (54)发明名称 一种视频目标跟踪方法及装置 (57)摘要 本发明提供一种视频目标跟踪 方法及装置。 所述方法包括: 将跟踪目标图像和搜索区域图像 分别输入到第一特征提取模块和第二特征提取 模块, 进行图像特征提取; 将跟踪目标特征和搜 索区域特征输入到基于交互注意力机制的特征 融合模块进行特征融合; 将融合特征输入到分类 和回归模块, 输出包围框内的图像类别及包围框 的位置及尺 寸信息。 本发明通过采用注意力机制 进行图像特征提取, 可获得感兴趣区域特征以提 高特征提取效率; 采用交互注 意力机制进行特征 融合使目标特征和搜索区域特征充分 交互, 解决 了现有技术因为光照、 形变、 遮挡等情况跟丢目 标的问题。 权利要求书2页 说明书7页 附图2页 CN 114708297 A 2022.07.05 CN 114708297 A 1.一种视频目标跟踪方法, 其特 征在于, 包括以下步骤: 将跟踪目标图像和搜索区域图像分别输入到基于注意力 机制、 结构和权重相同的第 一 特征提取模块和第二特 征提取模块, 进行图像特 征提取; 将提取的跟踪目标图像特征和搜索区域图像特征输入到基于交互注意力机制的特征 融合模块, 进行 特征融合; 将特征融合模块输出的融合特征输入到分类和回归模块, 输出包围框 内的图像类别及 包围框的位置及尺寸信息, 所述图像 类别包括前 景和背景。 2.根据权利要求1所述的视频目标跟踪方法, 其特征在于, 在特征提取前还包括: 将跟 踪目标图像和搜索区域图像分别输入到结构和权重相同的第一图像块编码模块和第二图 像块编码模块, 将输入图像分割成多个图像块, 并将每个图像块中的像素值合成为一个 向 量。 3.根据权利要求2所述的视频目标跟踪方法, 其特征在于, 所述第 一特征提取模块和第 二特征提取模块均采用Tr ansformer自注意力机制, 通过结构相似的窗口多头自注意力层 和移位窗口多头自注 意力层进行自注意力计算提取图像特征; 窗口多头自注意力 层将特征 图划分成大小为M的窗口, 并每个窗口上进 行自注意力计算; 移 位窗口多头自注意力 层在窗 口多头自注意力层的下一层, 通过将窗口整体平移1/2个M的大小, 在下一层得到新的窗口 以提高感受野, 并将平 移后的小窗口拼接以保证窗口 的数目不变。 4.根据权利要求3所述的视频目标跟踪方法, 其特征在于, 在特征融合前还包括: 将第 一特征提取模块和 第二特征提取模块提取的特征输入到特征级联模块, 将提取的两种特征 分别拉长为 一维向量后进行 连接, 将特 征图由三维数据平铺为 一维向量。 5.根据权利要求4所述的视频目标跟踪方法, 其特征在于, 所述特征融合模块包括编码 器和解码器, 编码器通过对特征级联模块输出 的一维向量进行自注意力计算, 实现对两种 特征的充分交互; 解码器采用交叉注意力机制, 通过对跟踪目标图像特征和搜索区域图像 特征分别进 行加权得到Q、 K、 V, 然后利用 分别进 行本分支和跨分支的注意力计算实现特征融合, 其中, Q、 K、 V为三个权重矩阵, dK为K的维 度。 6.根据权利要求1所述的视频目标跟踪方法, 其特征在于, 所述方法还包括: 在输入第 一帧图像前, 基于已知目标信息采用少样本学习 方法对网络模型进行离线训练; 在输入一 定帧图像后, 更新目标信息, 并采用少样本学习方法对网络模型进行在线更新。 7.一种视频目标跟踪装置, 其特 征在于, 包括: 注意力机制特征提取模块, 用于将跟踪目标图像和搜索区域图像分别 输入到基于注意 力机制、 结构和权 重相同的第一特 征提取模块和第二特 征提取模块, 进行图像特 征提取; 注意力机制特征融合模块, 用于将提取的跟踪目标图像特征和搜索区域图像特征输入 到基于交 互注意力机制的特 征融合模块, 进行 特征融合; 包围框分类回归模块, 用于将特征融合模块输出的融合特征输入到分类和回归模块, 输出包围框内的图像 类别及包围框的位置及尺寸信息, 所述图像 类别包括前 景和背景。 8.根据权利要求7所述的视频目标跟踪装置, 其特征在于, 在特征提取前还包括: 将跟 踪目标图像和搜索区域图像分别输入到结构和权重相同的第一图像块编码模块和第二图权 利 要 求 书 1/2 页 2 CN 114708297 A 2像块编码模块, 将输入图像分割成多个图像块, 并将每个图像块中的像素值合成为一个 向 量。 9.根据权利要求8所述的视频目标跟踪装置, 其特征在于, 所述第 一特征提取模块和第 二特征提取模块均采用Tr ansformer自注意力机制, 通过结构相似的窗口多头自注意力层 和移位窗口多头自注 意力层进行自注意力计算提取图像特征; 窗口多头自注意力 层将特征 图划分成大小为M的窗口, 并每个窗口上进 行自注意力计算; 移 位窗口多头自注意力 层在窗 口多头自注意力层的下一层, 通过将窗口整体平移1/2个M的大小, 在下一层得到新的窗口 以提高感受野, 并将平 移后的小窗口拼接以保证窗口 的数目不变。 10.根据权利要求9所述的视频目标跟踪装置, 其特征在于, 在特征融合前还包括: 将第 一特征提取模块和 第二特征提取模块提取的特征输入到特征级联模块, 将提取的两种特征 分别拉长为 一维向量后进行 连接, 将特 征图由三维数据平铺为 一维向量。权 利 要 求 书 2/2 页 3 CN 114708297 A 3
专利 一种视频目标跟踪方法及装置
文档预览
中文文档
12 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助3元下载(无需注册)
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助3元下载
本文档由 人生无常 于
2024-03-18 01:19:29
上传分享
举报
下载
原文档
(606.4 KB)
分享
友情链接
专利 导热膜.PDF
DB44-T 719-2010 中央供热水系统节能运行管理规范 广东省.pdf
T-CSAE 284.3—2022 自动驾驶乘用车 线控底盘性能要求及试验方法 第3部分:转向系统.pdf
GB 29518-2013 柴油发动机氮氧化物还原剂 尿素水溶液(AUS 32).pdf
DB51-T 2798-2021 公路旅游标志设置规范 四川省.pdf
GB-T 276-2013 滚动轴承 深沟球轴承 外形尺寸.pdf
DB37-T 3234-2018 动物源食品中泰万菌素残留量的测定 液相色谱—串联质谱法 山东省.pdf
中信证券 - 2022.4.13 - 信创市场,空间测算.pdf
GB 42295-2022 电动自行车电气安全要求.pdf
GB-T 33887-2017 无损检测仪器 工业光纤内窥镜检测仪.pdf
全知科技数据安全治理之数据安全风险评估白皮书.pdf
DB21-T 3090-2018 高密度聚乙烯渔业船舶建造标准 辽宁省.pdf
NY-T 4047-2021 家禽精液品质检测方法.pdf
GB-T 9813.3-2017 计算机通用规范 第3部分:服务器.pdf
T-CFLP 0016—2023 国有企业采购操作规范.pdf
GB-T 4625-2022 螺钉和螺母的装配工具 命名法.pdf
HJ 76—2017 固定污染源烟气(SO2、NOx、颗粒物)排放连续监测系统技术要求及检测方法.pdf
GA-T 1390.5-2017 信息安全技术 网络安全等级保护基本要求 第5部门 工业控制系统安全扩展要求.pdf
数据安全事件管理办法.pdf
GB-T 35561-2017 突发事件分类与编码.pdf
1
/
3
12
评价文档
赞助3元 点击下载(606.4 KB)
回到顶部
×
微信扫码支付
3
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。