iso file download
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211236445.0 (22)申请日 2022.10.10 (71)申请人 北京天融信网络安全技 术有限公司 地址 100085 北京市海淀区上地 东路1号院 3号楼四层 申请人 北京天融信科技有限公司   北京天融信软件 有限公司 (72)发明人 姚剑文  (74)专利代理 机构 北京超凡宏宇专利代理事务 所(特殊普通 合伙) 11463 专利代理师 刘广 (51)Int.Cl. G06F 21/56(2013.01) G06F 40/30(2020.01) G06F 40/284(2020.01)G06F 16/35(2019.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 威胁情报分类方法、 装置、 电子设备及存储 介质 (57)摘要 本申请提供一种威胁情报分类方法、 装置、 电子设备及存储介质。 该包括: 获取威胁情报文 本; 利用主题模型对威胁情报文本进行分析, 获 得主题模型输出的主题语义信息; 其中, 主题语 义信息包括威胁情报文本对应的主题描述和主 题词; 基于预先构建的威胁情报分类模型分别对 威胁情报文本和主题语义信息进行分析, 获得威 胁情报文本对应的文本上下文语义特征和主题 语义信息对应的主题语义特征; 基于文本上下文 语义特征和主题语义特征获得威胁情报所属的 类别。 本申请实施例通过融合了主题语义特征和 文本上下文语义特征, 从而提高了威胁情报分类 模型对威胁情 报文本进行分类的准确性。 权利要求书2页 说明书11页 附图3页 CN 115495744 A 2022.12.20 CN 115495744 A 1.一种威胁情 报分类方法, 其特 征在于, 包括: 获取威胁情 报文本; 利用主题模型对所述威胁情报文本进行分析, 获得所述主题模型输出的主题语义信 息; 其中, 所述主题语义信息包括所述 威胁情报文本对应的主题描述和主题词; 基于预先构建的威胁情报分类模型分别对所述威胁情报文本和所述主题语义信息进 行分析, 获得所述威胁情报文本对应的文本上下文语义特征和所述主题语义信息对应的主 题语义特 征; 基于所述文本上 下文语义特 征和所述主题语义特 征获得所述威胁情报所属的类别。 2.根据权利要求1所述的方法, 其特征在于, 所述利用主题模型对所述威胁情报文本进 行分析, 获得 所述主题模型输出的主题语义信息, 包括: 对所述威胁情报文本进行预处理, 获得分词结果; 其中, 所述预处理包括分词、 去除特 殊字符和去除停用词; 将所述分词结果输入主题模型, 获得 所述主题模型输出的主题语义信息 。 3.根据权利要求2所述的方法, 其特征在于, 所述将所述分词结果输入主题模型, 获得 所述主题模型输出的主题语义信息, 包括: 将所述分词结果输入主题模型, 获得 所述分词结果分别属于各个主题的权 重值; 将最大权 重值的主题对应的主题词作为所述分词结果的主题词; 根据最大权重值的主题对应的主题描述和所述分词结果的主题词获得所述主题语义 信息。 4.根据权利要求1所述的方法, 其特征在于, 所述威胁情报分类模型包括BERT模型, 所 述基于预先构建的威胁情报分类模型分别对所述威胁情报文本和所述主题语义信息进行 分析, 包括: 所述BERT模型分别对所述 威胁情报文本和所述主题语义信息进行分析。 5.根据权利要求1所述的方法, 其特征在于, 所述威胁情报分类模型包括全连接层; 所 述基于所述文本上下文语义特征和所述主题语义特征获得所述威胁情报文本所属的类别, 包括: 将所述文本上 下文语义特 征和所述主题语义特 征进行拼接, 获得分类特 征; 利用所述威胁情报分类模型中的全连接层对所述分类特征进行分析, 获得所述全连接 层输出的所述 威胁情报所属的类别。 6.根据权利要求 4所述的方法, 其特 征在于, 所述方法还 包括: 获取预训练BERT模型; 利用训练样本对所述预训练BERT模型进行微调, 获得训练好的所述BERT模型。 7.根据权利要求1 ‑6任一项所述的方法, 其特 征在于, 所述方法还 包括: 获取训练样本, 所述训练样本包括多个威胁情 报训练文本; 根据预设损失函数、 训练轮数、 批次大小和学习率, 利用所述多个威胁情报训练文本对 LDA模型进行训练, 获得训练好的所述主题模型。 8.一种威胁情 报分类装置, 其特 征在于, 包括: 获取模块, 用于获取威胁情 报文本; 主题分析模块, 用于利用主题模型对所述威胁情报文本进行分析, 获得所述主题模型权 利 要 求 书 1/2 页 2 CN 115495744 A 2输出的主题语义信息; 其中, 所述主题语义信息包括所述威胁情报文本对应的主题描述和 主题词; 特征提取模块, 用于基于预先构建的威胁情报分类模型分别对所述威胁情报文本和所 述主题语义信息进行分析, 获得所述威胁情报文本对应的文本上下文语义特征和所述主题 语义信息对应的主题语义特 征; 分类模块, 用于基于所述文本上下文语义特征和所述主题语义特征获得所述威胁情报 所属的类别。 9.一种电子设备, 其特 征在于, 包括: 处 理器、 存储器和总线, 其中, 所述处理器和所述存 储器通过 所述总线完成相互间的通信; 所述存储器存储有可被所述处理器执行的程序指令, 所述处理器调用所述程序指令能 够执行如权利要求1 ‑7任一项所述的方法。 10.一种非暂态计算机可读存储介质, 其特征在于, 所述非暂态计算机可读存储介质存 储计算机指 令, 所述计算机指 令被计算机运行时, 使 所述计算机执行如权利要求 1‑7任一项 所述的方法。权 利 要 求 书 2/2 页 3 CN 115495744 A 3

PDF文档 专利 威胁情报分类方法、装置、电子设备及存储介质

文档预览
中文文档 17 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 威胁情报分类方法、装置、电子设备及存储介质 第 1 页 专利 威胁情报分类方法、装置、电子设备及存储介质 第 2 页 专利 威胁情报分类方法、装置、电子设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:13:39上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。