专利 事件检测方法、装置、电子设备和存储介质

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210115899.6 (22)申请日 2022.01.28 (71)申请人北京百度网讯科技有限公司地址 100085 北京市海淀区上地十街10号百度大厦2层 (72)发明人冯博豪　 (74)专利代理机构中科专利商标代理有限责任公司 11021 专利代理师鄢功军 (51)Int.Cl. G16H 50/30(2018.01) G16H 50/70(2018.01) G06V 10/82(2022.01) G06V 20/40(2022.01) G06V 10/764(2022.01)G06V 40/20(2022.01) G06V 10/80(2022.01) G06F 16/35(2019.01) G06K 9/62(2022.01) G10L 25/45(2013.01) G10L 25/63(2013.01) (54)发明名称事件检测方法、装置、电子设备和存储介质 (57)摘要本公开提供了一种事件检测方法，涉及人工智能技术领域，尤其涉及计算机视觉技术领域和语音识别技术领域。具体实现方案为：根据与目标对象相关的第一文本信息，进行情绪识别，得到第一情绪信息；根据第一情绪信息，确定目标对象的情绪类别；响应于确定情绪类别表征预设情绪，获取与目标对象相关的视频流信息；以及根据视频流信息，进行事件检测。本公开还提供了一种事件检测装置、电子设备和存储介质。权利要求书4页说明书12页附图4页 CN 114496256 A 2022.05.13 CN 114496256 A 1.一种事件检测方法，包括：根据与目标对象相关的第一文本信息，进行情绪识别，得到第一情绪信息；根据所述第一情绪信息，确定所述目标对象的情绪类别；响应于确定所述情绪类别表征预设情绪，获取与目标对象相关的视频流信息；以及根据所述视频流信息，进行事件检测。 2.根据权利要求1所述的方法，其中，所述根据所述视频流信息，进行事件检测包括：根据所述视频流信息，得到第二文本信息；根据所述第二文本信息，进行情绪识别，得到第二情绪信息；以及根据所述第二情绪信息，进行事件检测。 3.根据权利要求1或2所述的方法，其中，通过以下操作进行情绪识别：响应于确定文本信息中字符数量小于或等于第一预设阈值，将所述文本信息与多个预设文本进行匹配，其中，每个预设文本对应一个情绪评估值；响应于匹配成功，根据与所述文本信息匹配的预设文本，得到所述文本信息的第一情绪评估值；对所述文本信息进行卷积处理，得到所述文本信息的第二情绪评估值；以及根据所述第一情绪评估值和所述第二情绪评估值，得到情绪信息。 4.根据权利要求1或2所述的方法，其中，通过以下操作进行情绪识别：响应于确定文本信息中字符数量大于第一预设阈值，将所述文本信息输入情绪分析模型，得到情绪信息。 5.根据权利要求4所述的方法，其中，所述情绪分析模型包括第一情绪分析子模型和第二情绪分析子模型，所述将所述文本信息输入情绪分析模型，得到情绪信息包括：响应于确定所述文本信息中字符数量小于或等于第二预设阈值，将所述文本信息输入所述第一情绪分析子模型，得到情绪信息；或者，响应于确定所述文本信息中字符数量大于第二预设阈值，将所述文本信息输入所述第二情绪分析子模型，得到情绪信息。 6.根据权利要求1或2所述的方法，其中，所述根据所述视频流信息，进行事件检测包括：根据所述视频流信息，确定所述目标对象的行为信息；以及根据所述行为信息，进行事件检测。 7.根据权利要求6所述的方法，其中，所述根据所述视频流信息，确定所述目标对象的行为信息包括：根据所述视频流信息，得到K个视频片段，其中， K为大于或等于1的整数；针对所述K个视频片段，对每个视频片段进行采样，得到K个图像帧集合，其中，每个图像帧集合包括至少一个图像帧；针对所述K个图像帧集合，对每个图像帧集合中的至少一个图像帧进行特征提取，得到 K个第一图像特征信息；对所述K个图像特征信息进行融合，得到第一融合特征信息；以及根据所述第一融合特征信息，确定所述行为信息。权　利　要　求　书 1/4 页 2 CN 114496256 A 28.根据权利要求2所述的方法，其中，所述根据所述视频流信息，得到第二文本信息包括：根据所述视频流信息，得到N个音频帧和M个图像帧，其中，每个音频帧对应一个图像帧， N为大于或等于1的整数， M为大于或等于1的整数；针对所述 N个音频帧，对每个音频帧进行特征提取，得到N个音频特征信息；针对所述M个图像帧，对每个图像帧进行切分，得到M个局部图像，其中，每个局部图像对应一个图像帧中的唇部区域；针对所述M个局部图像，对每个局部图像进行特征提取，得到 M个第二图像特征信息；将所述N个音频特征信息和所述M个第二图像特征信息进行融合，得到第二融合特征信息；以及根据所述第二融合特征信息，得到所述第二文本信息。 9.根据权利要求1所述的方法，其中，所述第一文本信息包括预设时段内的多个搜索文本信息，所述根据与目标对象相关的第一文本信息，进行情绪识别，得到第一情绪信息包括：根据多个所述搜索文本信息，得到多个搜索关键词；根据所述多个搜索关键词，进行情绪识别，得到多个第一情绪信息；所述根据所述第一情绪信息，确定所述目标对象的情绪类别包括：根据所述多个第一情绪信息和对应所述多个搜索文本信息的时间信息，确定所述目标对象在所述预设时段内的情绪变化趋势信息；以及根据所述情绪变化趋势信息，确定所述目标对象的情绪类别。 10.一种事件检测装置，包括：情绪识别模块，用于根据与目标对象相关的第一文本信息，进行情绪识别，得到第一情绪信息；第一确定模块，用于根据所述第一情绪信息，确定所述目标对象的情绪类别；获取模块，用于响应于确定所述情绪类别表征预设情绪，获取与目标对象相关的视频流信息；以及检测模块，用于根据所述视频流信息，进行事件检测。 11.根据权利要求10所述的装置，其中，所述检测模块包括：第一获得子模块，用于根据所述视频流信息，得到第二文本信息；第一情绪识别子模块，用于根据所述第二文本信息，进行情绪识别，得到第二情绪信息；以及第一检测子模块，用于根据所述第二情绪信息，进行事件检测。 12.根据权利要求10或11所述的装置，其中，所述情绪识别模块通过以下子模块执行相关操作进行情绪识别：匹配子模块，用于响应于确定文本信息中字符数量小于或等于第一预设阈值，将所述文本信息与多个预设文本进行匹配，其中，每个预设文本对应一个情绪评估值；第二获得子模块，用于响应于匹配成功，根据与所述文本信息匹配的预设文本，得到所述文本信息的第一情绪评估值；卷积子模块，用于对所述文本信息进行卷积处理，得到所述文本信息的第二情绪评估权　利　要　求　书 2/4 页 3 CN 114496256 A 3

专利 事件检测方法、装置、电子设备和存储介质

专利事件检测方法、装置、电子设备和存储介质