iso file download
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 20221080838 8.2 (22)申请日 2022.07.11 (71)申请人 福州大学 地址 350108 福建省福州市闽侯县福州大 学城乌龙江北 大道2号福州大 学 (72)发明人 柯逍 刘浩 (74)专利代理 机构 福州元创专利商标代理有限 公司 35100 专利代理师 丘鸿超 蔡学俊 (51)Int.Cl. G06V 20/40(2022.01) G06V 20/52(2022.01) G06V 40/10(2022.01) G06V 10/774(2022.01) G06V 10/82(2022.01)G06N 3/08(2006.01) (54)发明名称 基于非关键帧扰动 的视频序列样本增强方 法 (57)摘要 本发明涉及一种基于非关键帧扰动 的视频 序列样本增强方法, 包括步骤S1: 在网络训练过 程中, 将输入视频序列 样本送入视频行人重识别 网络模型中, 并根据网络输出结果计算损失; 步 骤S2: 对视频序列 样本计算其梯度方向; 步骤S3: 对视频序列中每一个视频帧计算该视频帧下的 梯度方向绝对值的总和; 步骤S4: 根据视频序列 中每一帧的总和值, 计算获得视频序列中前n_k 个总和值最大的帧的索引, 并视为此视频序列中 的关键帧; 步骤S5: 根据关键帧的索引, 对视频序 列中其他非关键帧进行随机高斯噪声扰动; 步骤 S6: 经过扰动后的非关键帧替换掉原视频序列中 对应索引的帧, 构建新的视频序列样本, 再次送 入视频重识别网络中进行后续训练。 权利要求书2页 说明书5页 附图1页 CN 115205741 A 2022.10.18 CN 115205741 A 1.一种基于非关键帧扰动的视频序列样本增强方法, 其特 征在于, 包括以下步骤: 步骤S1: 在网络训练过程中, 将输入视频序列样本送入视频行人重识别网络模型中, 并 根据网络 输出结果计算损失; 步骤S2: 对视频序列样本计算 其梯度方向; 步骤S3: 对视频序列中每一个视频帧计算该视频帧下的梯度方向绝对值的总和; 步骤S4: 根据视频序列中每一帧的总和值, 计算获得视频序列中前n_k个总和值最大的 帧的索引, 并视为此视频序列中的关键帧; 步骤S5: 根据关键帧的索引, 对视频序列中其 他非关键帧进行随机高斯噪声扰动; 步骤S6: 经过扰动后的非关键帧替换掉原视频序列中对应索引的帧, 构建新的视频序 列样本, 再次送入视频重识别网络中进行后续训练。 2.根据权利要求1所述的基于非关键帧扰动的视频序列样本增强方法, 其特征在于, 步 骤S1具体为: 步骤S11: 在网络训练过程中, 将输入视频序列样本n_x送入视频行人重识别网络模型 中, 由网络模型中的分类器获得分类分数n_α, 其中n_x的形状为5维张量, 分别是批次, 帧 数, 通道数, 高度, 宽度; 步骤S12: 根据分类分数n_α和视频序列样本类别标签值n_y, 通过交叉熵损失函数计算 损失, 并进行损失反向传播, 公式如下 所示: 其中 是n_α 的梯度, J()是交叉熵损失函数, model_θ表示网络参数。 3.根据权利要求1所述的基于非关键帧扰动的视频序列样本增强方法, 其特征在于, 步 骤S2具体为, 对视频序列样 本计算其梯度方向n_v, 公 式如下所示, 其中n_v的形状如输入视 频序列样本n_x, sign()表示对梯度方向进行符号计算, 对于大于0的梯度, 输出为1, 对于 小于0的梯度, 输出为 ‑1, 对于等于 0的梯度, 输出为0: 4.根据权利要求1所述的基于非关键帧扰动的视频序列样本增强方法, 其特征在于, 步 骤S3具体为, 对视频序列中每一个视频帧计算该视频帧下的梯度方向n_v绝对值的总和, 公 式如下所示, abs()表示对输入的梯度方向n_v的值取绝对值, sum()表示对输入的梯度方 向n_v的绝对值求和, dim表示sum()选择的维度, dim=[2, 3, 4]表示选择通道数, 高度, 宽 度; sumn_v=sum(abs(n_v) ), dim=[2, 3, 4]。 5.根据权利要求1所述的基于非关键帧扰动的视频序列样本增强方法, 其特征在于, 步 骤S4具体为, 根据视频序列中每一帧的总和值sumn_v, 计算获得视频序列中前n_k个总和值 最大的帧的索引k eyindex, 并将索引对 应的帧视为此视频序列中的关键帧, 其余为非关键帧, 公式如下所示, topk()表示获取sumn_v中前n_k个最值, dim表示topk()选择的维度, dim= [1]表示根据每个批次的求和结果进行排序; keyindex=topk(sumn_v), dim=[1]。 6.根据权利要求1所述的基于非关键帧扰动的视频序列样本增强方法, 其特征在于, 步 骤S5中, 根据关键帧的索引ke yindex, 对视频序列中其他非关键帧进行随机高斯噪声扰动, 公权 利 要 求 书 1/2 页 2 CN 115205741 A 2式如下所示, 其中随机高斯噪声noise_δ服从一个数学期望为μ、 标准方差为σ2的高斯分布 N, 形状大小如视频序列n_x, zero_l ike()表示 生成与输入数据形状相同的全0的数据: noise_ δ~N( μ, σ2) noise_ δ[keyindex]=zero_l ike(noise_ δ[keyindex])。 7.根据权利要求1所述的基于非关键帧扰动的视频序列样本增强方法, 其特征在于, 步 骤S6具体为, 经过扰动后的非关键帧替换掉原视频序列n_x中对应索引的帧, 构建新的视频 序列样本 其中noise_δ 中全0部分表示对应的帧为关键帧, 不进行扰动, 公式如下所示, 新的视频序列样本 送入视频 行人重识别网络中进行后续训练: 8.一种基于非关键帧扰动的视频序列样本增强系统, 其特征在于, 包括存储器、 处理器 以及存储于存储器上并能够被处理器运行的计算机程序指 令, 当处理器运行该计算机程序 指令时, 能够实现如权利要求1 ‑7其中任一所述的方法。 9.一种计算机可读存储介质, 其上存储有能够被处理器运行的计算机程序指令, 当处 理器运行 该计算机程序指令时, 能够实现如权利要求1 ‑7其中任一所述的方法。权 利 要 求 书 2/2 页 3 CN 115205741 A 3
专利 基于非关键帧扰动的视频序列样本增强方法
文档预览
中文文档
9 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助3元下载(无需注册)
温馨提示:本文档共9页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助3元下载
本文档由 SC 于
2024-03-03 12:17:20
上传分享
举报
下载
原文档
(594.6 KB)
分享
友情链接
T-CNPHARS 0001—2023 个体化用药遗传咨询指南.pdf
T-CEC 619—2022 输电线路导线压接X射线数字成像无损检测作业导则.pdf
T-CSBZ 007—2017 石材防水背胶.pdf
DB21-T 3870-2023 工业数字化转型典型场景评估规范 辽宁省.pdf
DB35-T 1764-2018 沿海地区金属屋面技术条件 福建省.pdf
DB52-T 1179-2017 磷矿开采磷石膏充填采矿技术规范 贵州省.pdf
SN-T 3005-2011 有机化学品中碳、氢、氮、硫含量的元素分析仪测定方法.pdf
SN-T 1732.23-2019 烟花爆竹用烟火药剂中铅、铬、镉、汞和砷含量的测定 电感耦合等离子体发射光谱法.pdf
DL-T 364-2019 光纤通道传输保护信息通用技术条件.pdf
T-GDFZ 0001—2018 无缝压胶服装.pdf
民航 CTSO-C145e 使用星基增强系统 SBAS 增强全球定位系统的机载导航传感器.pdf
GB-T 29766-2021 信息安全技术 网站数据恢复产品技术要求与测试评价方法.pdf
T-ACEF 107—2023 公民绿色低碳行为温室气体减排量化指南 行:地铁出行.pdf
GB-T 42260-2022 磷酸铁锂电化学性能测试 循环寿命测试方法.pdf
DB37-T 4649.4—2023 智能制造 第4部分:数字化车间评价体系指南 山东省.pdf
GB-T 21050-2019 信息安全技术网络交换机安全技术要求.pdf
数据出境管理办法.pdf
T-CFA 0310021—2023 铸造企业规范条件.pdf
TTAF 187—2023 框架型应用软件个人信息保护规范.pdf
GB-T 43411-2023 电子束选区熔化增材制造机床 通用技术条件.pdf
1
/
9
评价文档
赞助3元 点击下载(594.6 KB)
回到顶部
×
微信扫码支付
3
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。