iso file download
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 20221015915 0.1 (22)申请日 2022.02.21 (71)申请人 首都体育学院 地址 100191 北京市海淀区北三环西路1 1 号高德楼 201 (72)发明人 周志雄 王秋睿 (51)Int.Cl. G06V 20/40(2022.01) G06V 40/10(2022.01) G06V 10/764(2022.01) G06V 10/80(2022.01) G06V 10/82(2022.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种用于运动场地视频内容索引的自动多 标签方法 (57)摘要 本发明专利提供了一种用 于运动场地视频 内容索引的自动多标签方法。 其特征在于: (1)针 对一段视频, 用行人检测方法检测视频中人所在 的位置, 并根据位置用区域候选网络提取人所在 区域的特征; (2)用人体骨骼关键点检测方法提 取人的骨骼关键点位置, 并用图卷积模型提取人 的骨骼关键点位置的特征; (3)将上述两种特征 拼接融合后, 将不同帧的特征按照顺序输入到长 短时记忆模 型中, 并依靠模型给出该视频的多种 标签。 权利要求书1页 说明书2页 附图1页 CN 114519835 A 2022.05.20 CN 114519835 A 1.本发明专利提供了一种用于运动场 地视频内容索引的自动多标签方法。 其特征在于 如下步骤: (1)针对一段视频, 用行人检测方法检测视频中人所在的位置, 并根据位置用区 域候选网络提取人所在区域的特征; (2)用人体骨骼关键点检测方法提取人 的骨骼关键点 位置, 并用图卷积模型提取人的骨骼关键点位置的特征; (3)将上述两种特征拼接融合后, 将不同帧的特 征按照顺序输入到 长短时记 忆模型中, 并依靠模型 给出该视频的多种标签。权 利 要 求 书 1/1 页 2 CN 114519835 A 2一种用于运动场地视频内容索引的 自动多标签方 法 一、 技术领域 [0001]视频多标签分类、 计算机 视觉、 人工智能 二、 背景技术 [0002]2.1通用技 术方法介绍 [0003]人体2D骨骼关键点估计方法是利用单张图片或同一视角下的多帧图片对人体的 肩、 肘、 腕、 髋、 膝、 踝等关节等关键 部位生成二维坐标的方法。 [0004]卷积神经网络是利用卷积核在图片或特征上滑动提取特征的方法, 是广泛采用的 技术。 [0005]图卷积神经网络是一种能对图数据进行深度学习的方法。 [0006]长短时记忆模型(LSTM, Long Short‑Term Memory)是一种递归神经网络模型, 其 通过包元、 忘记门、 输入门、 输出门实现对有效内容的保留, 无效内容的丢失, 从而对时间特 征的变量 提取有效特 征。 [0007]Transformer[5]是一种注意力机制, 其主要用于神经网络的特征选择与特征融 合。 [0008]2.2相似方法介绍 [0009]利用常规卷积神经网络和图卷积神经网络的双流框架是图像内容理解常用的方 法, 例如文献[6]。 在此基础上, 文献[7]加入了Transformer模型用于特 征的强化。 [0010]上述方法可以处理单 张图像并进行图像的内容理解。 本方法与之的区别在于: (1) 对视频对象进行内容理解和多标签分类; (2)采用了长短时记忆模型(LSTM)对视频对象实 现多标签分类; (3)本方法的 Transformer针对卷积特征和图卷积特征进行特征选择, 已有 的方法仅针对卷积特 征。 三、 发明内容 [0011]本方法在融合了创新技术和已有方法的基础上, 实现了一种用于运动场地视频内 容索引的自动多标签方法。 [0012]首先, 针对一段视频, 用行人检测方法[1]检测视频中人所在的位置, 并根据位置 用区域候选网络RPN[1] 提取人所在区域的特 征。 [0013]其次, 用人体骨骼关键点检测方法[2]提取人的骨骼关键点位置, 并用图卷积模型 [3]提取人的骨骼关键点 位置的特 征。 [0014]最后, 将上述两种特征拼接融合后, 进一步用Transformer[5]模块进行特征选择, 强化有效特 征, 并依靠 长短时记 忆模型[4]给 出该视频的多种标签。 四、 附图说明 [0015]图1是本申请的方法的神经网络的结构图。 [0016]对于一段视频, 用两个支路提取特征。 一个用行人检测[1]方法找到人所在的矩形说 明 书 1/2 页 3 CN 114519835 A 3
专利 一种用于运动场地视频内容索引的自动多标签方法
文档预览
中文文档
5 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助3元下载(无需注册)
温馨提示:本文档共5页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助3元下载
本文档由 人生无常 于
2024-03-18 01:19:01
上传分享
举报
下载
原文档
(254.2 KB)
分享
友情链接
GB-T 6826-2005 洗选设备 系列型谱.pdf
工业数据分类分级指南(试行).pdf
DB31-T 444-2022 排水管道电视和声呐检测评估技术规程 上海市.pdf
GB-T 15911-2021 工业电热设备节能监测方法.pdf
GB-T 3620.1-2016 钛及钛合金牌号和化学成分.pdf
DB44-T 2149-2018 森林资源规划设计调查技术规程 广东省.pdf
风险评估管理制度.pdf
DB53-T 1137-2023 公路建设项目电子文件与电子档案管理系统建设指南 云南省.pdf
GB-T 41303-2022 塔式太阳能热发电站吸热器技术要求.pdf
ISO IEC 27001-2022.pdf
GB-T 43709-2024 资产管理信息化 数据质量管理要求.pdf
DB4503-T 0044-2022 机关事务信息化功能建设规范 桂林市.pdf
T-GCHA 1.2—2018 定制家居产品 人造板定制衣柜 第2部分:原材料验收规范.pdf
GB-T 21141-2007 防沙治沙技术规范.pdf
T-CQMBA 1—2023 医院消毒供应中心过程质量控制管理技术及应用指南第1部分:质量可追溯记录.pdf
GB-T 31495.3-2015 信息安全技术 信息安全保障指标体系及评价方法 第3部分:实施指南.pdf
GBJ 93-86 工业自动化仪表施工验收.pdf
DB3311-T 76─2018 杨梅主要病虫害绿色防控技术规程 丽水市.pdf
ISO 14064-1 2018 温室气体 第1部分 组织层面温室气体排放量和清除量量化和报告指南规范 中文.pdf
GB-T 3977-2008 颜色的表示方法.pdf
1
/
3
5
评价文档
赞助3元 点击下载(254.2 KB)
回到顶部
×
微信扫码支付
3
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。