iso file download
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210115899.6 (22)申请日 2022.01.28 (71)申请人 北京百度网讯科技有限公司 地址 100085 北京市海淀区上地十街10号 百度大厦2层 (72)发明人 冯博豪  (74)专利代理 机构 中科专利商标代理有限责任 公司 11021 专利代理师 鄢功军 (51)Int.Cl. G16H 50/30(2018.01) G16H 50/70(2018.01) G06V 10/82(2022.01) G06V 20/40(2022.01) G06V 10/764(2022.01)G06V 40/20(2022.01) G06V 10/80(2022.01) G06F 16/35(2019.01) G06K 9/62(2022.01) G10L 25/45(2013.01) G10L 25/63(2013.01) (54)发明名称 事件检测方法、 装置、 电子设备和存 储介质 (57)摘要 本公开提供了一种事件检测方法, 涉及人工 智能技术领域, 尤其涉及计算机视觉技术领域和 语音识别技术领域。 具体实现方案为: 根据与目 标对象相关的第一文本信息, 进行情绪识别, 得 到第一情绪信息; 根据第一情绪信息, 确定目标 对象的情绪类别; 响应于确定情绪类别表征预设 情绪, 获取与目标对象相关的视频流信息; 以及 根据视频流信息, 进行事件检测。 本公开还提供 了一种事 件检测装置、 电子设备和存 储介质。 权利要求书4页 说明书12页 附图4页 CN 114496256 A 2022.05.13 CN 114496256 A 1.一种事 件检测方法, 包括: 根据与目标对象相关的第一文本信息, 进行情绪识别, 得到第一情绪信息; 根据所述第一情绪信息, 确定所述目标对象的情绪类别; 响应于确定所述情绪类别表征 预设情绪, 获取与目标对象相关的视频流信息; 以及 根据所述视频流信息, 进行事 件检测。 2.根据权利要求1所述的方法, 其中, 所述 根据所述视频流信息, 进行事 件检测包括: 根据所述视频流信息, 得到第二文本信息; 根据所述第二文本信息, 进行情绪识别, 得到第二情绪信息; 以及 根据所述第二情绪信息, 进行事 件检测。 3.根据权利要求1或2所述的方法, 其中, 通过以下操作进行情绪识别: 响应于确定文本信息中字符数量小于或等于第一预设阈值, 将所述文本信息与多个预设文本进行匹配, 其中, 每 个预设文本对应一个情绪评估值; 响应于匹配成功, 根据与所述文本信息匹配的预设文本, 得到所述文本信息的第一情 绪评估值; 对所述文本信息进行 卷积处理, 得到所述文本信息的第二情绪评估值; 以及 根据所述第一情绪评估值和所述第二情绪评估值, 得到情绪信息 。 4.根据权利要求1或2所述的方法, 其中, 通过以下操作进行情绪识别: 响应于确定文本信息中字符数量大于第一预设阈值, 将所述文本信息 输入情绪分析模型, 得到情绪信息 。 5.根据权利要求4所述的方法, 其中, 所述情绪分析模型包括第 一情绪分析子模型和第 二情绪分析子模型, 所述将所述文本信息 输入情绪分析模型, 得到情绪信息包括: 响应于确定所述文本信 息中字符数量小于或等于第 二预设阈值, 将所述文本信 息输入 所述第一情绪分析子模型, 得到情绪信息; 或者, 响应于确定所述文本信 息中字符数量大于第 二预设阈值, 将所述文本信 息输入所述第 二情绪分析子模型, 得到情绪信息 。 6.根据权利要求1或2所述的方法, 其中, 所述根据所述视频流信息, 进行事件检测包 括: 根据所述视频流信息, 确定所述目标对象的行为信息; 以及 根据所述行为信息, 进行事 件检测。 7.根据权利要求6所述的方法, 其中, 所述根据所述视频流信息, 确定所述目标对象的 行为信息包括: 根据所述视频流信息, 得到K个视频片段, 其中, K为大于或等于1的整数; 针对所述K个视频片段, 对每个视频片段进行采样, 得到K个图像帧集合, 其中, 每个图 像帧集合包括至少一个图像帧; 针对所述K个图像帧集合, 对每个图像帧集合中的至少一个图像帧进行特征提取, 得到 K个第一图像特 征信息; 对所述K个图像特 征信息进行融合, 得到第一融合特 征信息; 以及 根据所述第一融合特 征信息, 确定所述行为信息 。权 利 要 求 书 1/4 页 2 CN 114496256 A 28.根据权利要求2所述的方法, 其中, 所述根据所述视频流信息, 得到第二文本信息包 括: 根据所述视频流信息, 得到N个音频帧和M个图像帧, 其中, 每个音频帧对应一个图像 帧, N为大于或等于1的整数, M为大于或等于1的整数; 针对所述 N个音频帧, 对每 个音频帧进行 特征提取, 得到N个音频 特征信息; 针对所述M个图像帧, 对每个图像帧进行切分, 得到M个局部图像, 其中, 每个局部图像 对应一个图像帧中的唇部区域; 针对所述M个局部图像, 对每 个局部图像进行 特征提取, 得到 M个第二图像特 征信息; 将所述N个音频特征信 息和所述M个第二图像特征信息进行融合, 得到第 二融合特征信 息; 以及 根据所述第二融合特 征信息, 得到所述第二文本信息 。 9.根据权利要求1所述的方法, 其中, 所述第 一文本信 息包括预设时段内的多个搜索文 本信息, 所述根据与目标对象相关的第一文本信息, 进行情绪识别, 得到第一情绪信息包括: 根据多个所述搜索文本信息, 得到多个搜索关键词; 根据所述多个搜索关键词, 进行情绪识别, 得到多个第一情绪信息; 所述根据所述第一情绪信息, 确定所述目标对象的情绪类别包括: 根据所述多个第 一情绪信 息和对应所述多个搜索文本信 息的时间信 息, 确定所述目标 对象在所述预设时段内的情绪变化趋势信息; 以及 根据所述情绪变化趋势信息, 确定所述目标对象的情绪类别。 10.一种事 件检测装置, 包括: 情绪识别模块, 用于根据与目标对象相关的第 一文本信 息, 进行情绪识别, 得到第一情 绪信息; 第一确定模块, 用于根据所述第一情绪信息, 确定所述目标对象的情绪类别; 获取模块, 用于响应于确定所述情绪类别表征预设情绪, 获取与目标对象相关的视频 流信息; 以及 检测模块, 用于根据所述视频流信息, 进行事 件检测。 11.根据权利要求10所述的装置, 其中, 所述检测模块包括: 第一获得子模块, 用于根据所述视频流信息, 得到第二文本信息; 第一情绪识别子模块, 用于根据所述第二文本信息, 进行情绪识别, 得到第二情绪信 息; 以及 第一检测子模块, 用于根据所述第二情绪信息, 进行事 件检测。 12.根据权利要求10或11所述的装置, 其中, 所述情绪识别模块通过以下子模块执行相 关操作进行情绪识别: 匹配子模块, 用于响应于确定文本信息中字符数量小于或等于第一预设阈值, 将所述 文本信息与多个预设文本进行匹配, 其中, 每 个预设文本对应一个情绪评估值; 第二获得子模块, 用于响应于匹配成功, 根据与所述文本信 息匹配的预设文本, 得到所 述文本信息的第一情绪评估值; 卷积子模块, 用于对所述文本信息进行卷积处理, 得到所述文本信息的第二情绪评估权 利 要 求 书 2/4 页 3 CN 114496256 A 3

.PDF文档 专利 事件检测方法、装置、电子设备和存储介质

文档预览
中文文档 21 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 事件检测方法、装置、电子设备和存储介质 第 1 页 专利 事件检测方法、装置、电子设备和存储介质 第 2 页 专利 事件检测方法、装置、电子设备和存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 01:19:59上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。