iso file download
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211236445.0 (22)申请日 2022.10.10 (71)申请人 北京天融信网络安全技 术有限公司 地址 100085 北京市海淀区上地 东路1号院 3号楼四层 申请人 北京天融信科技有限公司 北京天融信软件 有限公司 (72)发明人 姚剑文 (74)专利代理 机构 北京超凡宏宇专利代理事务 所(特殊普通 合伙) 11463 专利代理师 刘广 (51)Int.Cl. G06F 21/56(2013.01) G06F 40/30(2020.01) G06F 40/284(2020.01)G06F 16/35(2019.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 威胁情报分类方法、 装置、 电子设备及存储 介质 (57)摘要 本申请提供一种威胁情报分类方法、 装置、 电子设备及存储介质。 该包括: 获取威胁情报文 本; 利用主题模型对威胁情报文本进行分析, 获 得主题模型输出的主题语义信息; 其中, 主题语 义信息包括威胁情报文本对应的主题描述和主 题词; 基于预先构建的威胁情报分类模型分别对 威胁情报文本和主题语义信息进行分析, 获得威 胁情报文本对应的文本上下文语义特征和主题 语义信息对应的主题语义特征; 基于文本上下文 语义特征和主题语义特征获得威胁情报所属的 类别。 本申请实施例通过融合了主题语义特征和 文本上下文语义特征, 从而提高了威胁情报分类 模型对威胁情 报文本进行分类的准确性。 权利要求书2页 说明书11页 附图3页 CN 115495744 A 2022.12.20 CN 115495744 A 1.一种威胁情 报分类方法, 其特 征在于, 包括: 获取威胁情 报文本; 利用主题模型对所述威胁情报文本进行分析, 获得所述主题模型输出的主题语义信 息; 其中, 所述主题语义信息包括所述 威胁情报文本对应的主题描述和主题词; 基于预先构建的威胁情报分类模型分别对所述威胁情报文本和所述主题语义信息进 行分析, 获得所述威胁情报文本对应的文本上下文语义特征和所述主题语义信息对应的主 题语义特 征; 基于所述文本上 下文语义特 征和所述主题语义特 征获得所述威胁情报所属的类别。 2.根据权利要求1所述的方法, 其特征在于, 所述利用主题模型对所述威胁情报文本进 行分析, 获得 所述主题模型输出的主题语义信息, 包括: 对所述威胁情报文本进行预处理, 获得分词结果; 其中, 所述预处理包括分词、 去除特 殊字符和去除停用词; 将所述分词结果输入主题模型, 获得 所述主题模型输出的主题语义信息 。 3.根据权利要求2所述的方法, 其特征在于, 所述将所述分词结果输入主题模型, 获得 所述主题模型输出的主题语义信息, 包括: 将所述分词结果输入主题模型, 获得 所述分词结果分别属于各个主题的权 重值; 将最大权 重值的主题对应的主题词作为所述分词结果的主题词; 根据最大权重值的主题对应的主题描述和所述分词结果的主题词获得所述主题语义 信息。 4.根据权利要求1所述的方法, 其特征在于, 所述威胁情报分类模型包括BERT模型, 所 述基于预先构建的威胁情报分类模型分别对所述威胁情报文本和所述主题语义信息进行 分析, 包括: 所述BERT模型分别对所述 威胁情报文本和所述主题语义信息进行分析。 5.根据权利要求1所述的方法, 其特征在于, 所述威胁情报分类模型包括全连接层; 所 述基于所述文本上下文语义特征和所述主题语义特征获得所述威胁情报文本所属的类别, 包括: 将所述文本上 下文语义特 征和所述主题语义特 征进行拼接, 获得分类特 征; 利用所述威胁情报分类模型中的全连接层对所述分类特征进行分析, 获得所述全连接 层输出的所述 威胁情报所属的类别。 6.根据权利要求 4所述的方法, 其特 征在于, 所述方法还 包括: 获取预训练BERT模型; 利用训练样本对所述预训练BERT模型进行微调, 获得训练好的所述BERT模型。 7.根据权利要求1 ‑6任一项所述的方法, 其特 征在于, 所述方法还 包括: 获取训练样本, 所述训练样本包括多个威胁情 报训练文本; 根据预设损失函数、 训练轮数、 批次大小和学习率, 利用所述多个威胁情报训练文本对 LDA模型进行训练, 获得训练好的所述主题模型。 8.一种威胁情 报分类装置, 其特 征在于, 包括: 获取模块, 用于获取威胁情 报文本; 主题分析模块, 用于利用主题模型对所述威胁情报文本进行分析, 获得所述主题模型权 利 要 求 书 1/2 页 2 CN 115495744 A 2输出的主题语义信息; 其中, 所述主题语义信息包括所述威胁情报文本对应的主题描述和 主题词; 特征提取模块, 用于基于预先构建的威胁情报分类模型分别对所述威胁情报文本和所 述主题语义信息进行分析, 获得所述威胁情报文本对应的文本上下文语义特征和所述主题 语义信息对应的主题语义特 征; 分类模块, 用于基于所述文本上下文语义特征和所述主题语义特征获得所述威胁情报 所属的类别。 9.一种电子设备, 其特 征在于, 包括: 处 理器、 存储器和总线, 其中, 所述处理器和所述存 储器通过 所述总线完成相互间的通信; 所述存储器存储有可被所述处理器执行的程序指令, 所述处理器调用所述程序指令能 够执行如权利要求1 ‑7任一项所述的方法。 10.一种非暂态计算机可读存储介质, 其特征在于, 所述非暂态计算机可读存储介质存 储计算机指 令, 所述计算机指 令被计算机运行时, 使 所述计算机执行如权利要求 1‑7任一项 所述的方法。权 利 要 求 书 2/2 页 3 CN 115495744 A 3
专利 威胁情报分类方法、装置、电子设备及存储介质
文档预览
中文文档
17 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助3元下载(无需注册)
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助3元下载
本文档由 SC 于
2024-03-03 12:13:39
上传分享
举报
下载
原文档
(536.1 KB)
分享
友情链接
GB-T 30732-2014 煤的工业分析方法 仪器法.pdf
GB-T 38548.2-2020 内容资源数字化加工 第2部分:采集方法.pdf
T-CESA 1220—2022 服务器管理北向接口技术要求.pdf
GB-T 38541-2020 信息安全技术 电子文件密码应用指南.pdf
思度安全-DSMM-016 合规管理规范V1.0.pdf
ISO IEC 27019 2017 Information technology — Security techniques — Information security controls for the energy utility industry.pdf
GB-T 20239-2023 体育馆用木质地板.pdf
GB-T 39116-2020 智能制造能力成熟度模型.pdf
GB-T 32894-2016 抽水蓄能机组工况转换技术导则.pdf
GB-T 8259-2008 卡箍式柔性管接头 技术条件.pdf
GB 29518-2013 柴油发动机氮氧化物还原剂 尿素水溶液(AUS 32).pdf
HS-T 42-2014 海关信息系统运维服务保障等级定级规范.pdf
JBOSS服务器安全配置基线.doc
GB-T 39768-2021 人类生物样本分类与编码.pdf
GB-T 20282-2006 信息安全技术 信息系统安全工程管理要求.pdf
MZ-T 175.1-2021 康复辅助器具租赁 第1部分:服务规范.pdf
T-CSAE 252—2022 智能网联汽车车载端信息安全测试规程.pdf
T-NIFA 26—2023 移动金融客户端应用软件上架资质指引.pdf
GB 29437-2012 工业冰醋酸单位产品能源消耗限额.pdf
GB-T 22033-2017 信息技术 嵌入式系统术语.pdf
1
/
17
评价文档
赞助3元 点击下载(536.1 KB)
回到顶部
×
微信扫码支付
3
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。