iso file download
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211139243.4 (22)申请日 2022.09.19 (71)申请人 深圳市万物云科技有限公司 地址 518000 广东省深圳市前海深港合作 区前湾一路1号A栋201室 (入驻深圳市 前海商务秘书 有限公司) 申请人 深圳市第五空间 网络科技有限公司 (72)发明人 袁戟 黄月红 (74)专利代理 机构 深圳市精英专利事务所 44242 专利代理师 王暄 (51)Int.Cl. G06F 16/78(2019.01) G06F 16/783(2019.01) G06F 16/735(2019.01)G06F 16/75(2019.01) G06V 30/414(2022.01) G06F 40/30(2020.01) G06F 40/216(2020.01) G06N 5/00(2006.01) G06N 20/20(2019.01) G10L 15/26(2006.01) (54)发明名称 基于OCR和ASR的短视频推荐方法、 装置及相 关设备 (57)摘要 本发明公开了基于OCR和ASR的短视频推荐 方法、 装置及相关设备。 该方法对用户产生过行 为数据的短视频的关键帧进行OCR识别, 提取关 键帧的视频文本, 并对视频文本进行关键字提 取, 得到视频关键字; 获取短视频的音频数据, 通 过ASR语音识别技术对音频数据进行语义识别, 得到有断句的语音文本, 并对语音文本进行关键 字提取, 得到音频关键字; 对视频关键字和音频 关键字进行合并, 得到合并文本, 并通过预置的 SmoothNLP模型对合并文本进行关键词提取, 得 到关键新词; 对关键新词进行过滤提取对应的标 签数据, 并根据标签数据对不同用户进行聚类; 对聚类后的每一类别用户, 将对应的关键新词输 入预训练的LightGBM模型进行视 频推荐, 得到推 荐视频。 该方法提升用户的使用体验感。 权利要求书2页 说明书7页 附图2页 CN 115510274 A 2022.12.23 CN 115510274 A 1.一种基于OCR和ASR的短视频推荐方法, 其特 征在于, 包括: 对用户产生过行为数据的短视频的关键帧进行OCR识别, 得到所述关键帧的视频文本, 并基于预训练的TFIDF模型对所述视频文本进行关键 字提取, 得到 视频关键 字; 获取所述短视频的音频数据, 通过ASR语音识别技术对所述音频数据进行语义识别, 得 到有断句的语音文本, 并通过所述T FIDF模型对所述语音文本进 行关键字提取, 得到音频关 键字; 对所述视频关键字和音频关键字进行合并, 得到合并文本, 并通过预置的S moothNLP模 型对所述 合并文本进行关键词提取, 得到关键新词; 对所述关键新词进行过滤提取对应的标签数据, 并根据 所述标签数据对不同用户进行 聚类; 对聚类后的每一类别用户, 将对应的所述关键新词输入预训练的LightGBM模型进行视 频推荐, 得到推荐视频。 2.根据权利 要求1所述的基于OCR和ASR的短视频推荐方法, 其特征在于, 所述对用户产 生过行为数据的短视频的关键帧进行OCR识别, 得到所述关键帧的视频文本之前, 包括: 对所述短视频进行均匀抽帧处 理, 得到多张帧图像; 对所有帧图像进行相关性检测, 得到每一张帧图像之间的相关性, 保留相关性小的帧 图像作为所述关键帧。 3.根据权利 要求1所述的基于OCR和ASR的短视频推荐方法, 其特征在于, 所述通过预置 的SmoothNLP模型对所述 合并文本进行关键词提取, 得到关键新词, 包括: 计算所述合并文本 中任意两个字符串的互信 息, 并根据 所述互信 息确定所述合并文本 中每一候选词的平均互信息; 计算所述合并文本 中每一候选词的信 息熵, 并基于所述信 息熵和平均互信 息确定每一 候选词的候选词评分, 以候选词评分高的候选词作为关键新词。 4.根据权利 要求3所述的基于OCR和ASR的短视频推荐方法, 其特征在于, 所述计算所述 合并文本中任意两个字符串的互信息, 并根据所述互信息确定所述合并文本中每一候选词 的平均互信息, 包括: 按如下公式计算所述 合并文本中任意两个字符串的互信息 MI: 其中, s1、 s2分别表示所述合并文本中的任意两个字符串, p表示概率函数, ln表示自然 对数运算; 按如下公式计算所述 合并文本中每一 候选词的平均互信息AMI: 其中, W表示 候选词, n表示 候选词内字符串的数量。 5.根据权利 要求4所述的基于OCR和ASR的短视频推荐方法, 其特征在于, 所述计算所述 合并文本中每一 候选词的信息熵, 包括:权 利 要 求 书 1/2 页 2 CN 115510274 A 2按如下公式计算所述信息熵L(W): 其中, LE表示左 邻熵, RE表示右邻熵, e表示自然底数。 6.根据权利 要求5所述的基于OCR和ASR的短视频推荐方法, 其特征在于, 所述基于所述 信息熵和平均互信息确定每一 候选词的候选词评分, 包括: 按如下公式计算所述 候选词评分 score: score=α·L(W)+β·AMI(W), 其中, α 、 β 分别表示比例常数。 7.根据权利 要求1所述的基于OCR和ASR的短视频推荐方法, 其特征在于, 所述对聚类后 的每一类别用户, 将对应的所述关键新词输入预训练的LightGBM模型进行视频推荐, 得到 推荐视频之后, 还 包括: 采用如下评估指标对所述推荐视频进行评估: 其中, γ表示1和2的常数, 取1表示F1, 取2表示F2, P表示准确率, R表示召回率。 8.一种基于OCR和ASR的短视频推荐装置, 其特 征在于, 包括: 视频关键字提取模块, 用于对用户产生过行为数据的短视频的关键帧进行OCR识别, 得 到所述关键帧的视频文本, 并基于预训练的TFIDF模型对所述视频文本进 行关键字提取, 得 到视频关键 字; 音频关键字提取模块, 用于获取所述短视频的音频数据, 通过ASR语音识别技术对所述 音频数据进 行语义识别, 得到有断句的语音文本, 并通过所述T FIDF模型对所述语音文本进 行关键字提取, 得到音频关键 字; 新词提取模块, 用于对所述视频关键字和音频关键字进行合并, 得到合并文本, 并通过 预置的Smo othNLP模型对所述 合并文本进行关键词提取, 得到关键新词; 聚类模块, 用于对所述关键新词进行过滤提取对应的标签数据, 并根据所述标签数据 对不同用户进行聚类; 推荐模块, 用于对聚类后的每一类别用户, 将对应的所述关键新词输入预训练的 LightGBM模型进行视频推荐, 得到推荐视频。 9.一种计算机设备, 包括存储器、 处理器及存储在所述存储器上并可在所述处理器上 运行的计算机程序, 其特征在于, 所述处理器执行所述计算机程序时实现如权利要求1至7 中任一项所述的基于OCR和ASR的短视频推荐方法。 10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质存储有计算机程 序, 所述计算机程序当被处理器执行时使 所述处理器执行如权利要求 1至7任一项 所述的基 于OCR和ASR的短视频推荐方法。权 利 要 求 书 2/2 页 3 CN 115510274 A 3
专利 基于OCR和ASR的短视频推荐方法、装置及相关设备
文档预览
中文文档
12 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助3元下载(无需注册)
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助3元下载
本文档由 SC 于
2024-03-03 12:13:48
上传分享
举报
下载
原文档
(638.1 KB)
分享
友情链接
GB-T 16597-2019 冶金产品分析方法 X射线荧光光谱法通则.pdf
DB11-T 344-2017 陶瓷墙地砖胶粘剂施工技术规程 北京市.pdf
DB15-T 1873—2020 大数据平台 数据接入质量规范 内蒙古自治区.pdf
GB-T 30273-2013 信息安全技术 信息系统安全保障通用评估指南.pdf
DB37-T 3483-2019 人民防空可视化互联平台功能要求 山东省.pdf
CCSP OSG 云安全专业认证 第三版 中文.pdf
浅谈城商行数据安全现状 - 20200226.pdf
GB-T 5838.3-2015 荧光粉 第3部分:性能试验方法.pdf
20230129-中信建投-人工智能行业从CHAT_GPT到生成式AI(Generative AI):人工智能新范式,重新定义生产力.pdf
T-ZGCSC 003—2023 智慧社区评价指标体系.pdf
CH-T 4024-2019 《城市政务电子地图更新技术规范》.pdf
T-GHDQ 88.1—2022 车辆无线通信安全测试规范 第1部分:车载蓝牙安全测试规范.pdf
绿盟 赵粮 大模型浪潮下的全球网络安全思考-2023TechWorld-final.pdf
T-SDL 3.1—2021 10kV智能电缆系统技术规范 第1部分 导则.pdf
GB-T 33767.5-2018 信息技术 生物特征样本质量 第5部分:人脸图像数据.pdf
GB-T 12452-2022 水平衡测试通则.pdf
GB-T 14926.8-2001 实验动物 支原体检测方法.pdf
GB-T 11469-2013 无线电高度表通用规范.pdf
GB-T 24822-2009 家用和类似用途电器维修故障编码规范.pdf
GB-T 25970-2010 不燃无机复合板.pdf
1
/
12
评价文档
赞助3元 点击下载(638.1 KB)
回到顶部
×
微信扫码支付
3
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。