(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211144241.4
(22)申请日 2022.09.20
(71)申请人 中国建设银行股份有限公司
地址 100033 北京市西城区金融大街25号
申请人 建信金融科技有限责任公司
(72)发明人 陈翟翟 雷发林 吴泽君 李国莹
苑志云
(74)专利代理 机构 北京润平知识产权代理有限
公司 11283
专利代理师 李红
(51)Int.Cl.
G06F 16/332(2019.01)
G06F 40/284(2020.01)
G06F 40/30(2020.01)
(54)发明名称
故障场景文档快速匹配方法、 装置、 存储介
质及处理器
(57)摘要
本申请实施例提供一种故障场景文档快速
匹配方法、 装置、 存储介质及处理器, 属于计算机
技术领域。 该方法包括: 获取故障查询语句; 根据
所述故障查询语句, 从故障场景文档数据集中获
取目标语义相近词列表、 所述目标语义相近词列
表中词汇的目标特征、 所述目标语义相近词列表
中词汇与故障场景文档数据集中不同故障场景
文档的关键词之间的相似程度; 根据所述目标特
征以及所述相似程度获取目标 故障场景文档。 该
故障场景文档快速匹配方法汇集多方收集到的
故障场景文档, 提供根据故障查询语句快速匹配
故障场景文档的能力。
权利要求书2页 说明书10页 附图2页
CN 115470335 A
2022.12.13
CN 115470335 A
1.一种基于海量运维数据和知识的故障场景文档快速匹配方法, 其特征在于, 所述方
法包括:
获取故障查询语句;
根据所述故障查询语句, 从故障场景文档数据集中获取目标语义相近词列表、 所述目
标语义相近词 列表中词汇的目标特征、 所述目标语义相近词列 表中词汇与故障场景文档数
据集中不同故障场景文档的关键词之间的相似程度;
根据所述目标 特征以及所述相似程度获取目标故障场景文档。
2.根据权利要求1所述的基于海量运维数据和知识的故障场景文档快速匹配方法, 其
特征在于, 所述根据所述故障查询 语句, 从故障场景文档数据集中获取目标语义相 近词列
表, 包括:
对所述故障查询语句进行分词, 得到不同的查询词汇;
根据所述 查询词汇从故障场景文档数据集中获取目标语义相近词列表。
3.根据权利要求1所述的基于海量运维数据和知识的故障场景文档快速匹配方法, 其
特征在于, 根据所述目标 特征以及所述相似程度获取目标故障场景文档, 包括:
根据所述目标特征以及所述相似程度计算总体加权值, 得到各个故障场景文档的加权
得分;
获取加权得分最高的故障场景文档作为目标故障场景文档输出。
4.根据权利要求3所述的基于海量运维数据和知识的故障场景文档快速匹配方法, 其
特征在于, 根据所述目标 特征以及所述相似程度计算总体加权值, 包括:
根据如下公式进行加权计算:
其中, m表示故障查询语句转化后的查询词汇个数, iwp表示第p个查询词汇; n表示某个
故障场景文档拥有的关键词个数, dwk表示某个故障场景文档中 的第k个关键词; T表示词汇
的特征; J表示词汇之间的语义近似程度。
5.根据权利要求1所述的基于海量运维数据和知识的故障场景文档快速匹配方法, 其
特征在于, 所述 故障场景文档数据集包括: 故障场景文档中词汇的语义相近词 列表、 故障场
景文档中词汇的相 近程度、 故障场景文档中词汇的特征、 不同故障场景文档的关键词集合
以及不同的故障场景文档。
6.根据权利要求5所述的基于海量运维数据和知识的故障场景文档快速匹配方法, 其
特征在于, 故障场景文档中词汇的特 征采用如下 方式获取:
统计各词汇在所有故障场景文档中的第一频率以及各词汇在各个故障场景文档中的
第二频率;
根据所述第一频率和所述第二频率计算各词汇在各个故障场景文档中的特 征。
7.根据权利要求6所述的基于海量运维数据和知识的故障场景文档快速匹配方法, 其
特征在于, 不同故障场景文档的关键词集 合采用如下 方式获取:
将各词汇在各个故障场景文档中的特征与阈值进行比较, 将特征大于 阈值的词汇作为
关键词;权 利 要 求 书 1/2 页
2
CN 115470335 A
2同一故障场景文档的关键词构成该故障场景文档的关键词集 合。
8.根据权利要求6所述的基于海量运维数据和知识的故障场景文档快速匹配方法, 其
特征在于, 故障场景文档中词汇的相近程度通过如下 方式计算:
对故障场景文档进行分词处 理;
设定滑动窗口, 滑动窗口包括中心词和辅助词;
计算两个相同滑动窗口中的中心词之间的相近程度, 得到故障场景文档中词汇的相近
程度。
9.根据权利要求8所述的基于海量运维数据和知识的故障场景文档快速匹配方法, 其
特征在于, 所述计算两个相同滑动窗口中的中心词之间的相近程度, 包括:
根据如下公式计算两个相同滑动窗口中的中心词之间的相近程度:
J(中心词1,中心词2)=相同辅助词个数/ 辅助词总数。
10.根据权利要求8所述的基于海量运维数据和知识的故障场景文档快速匹配方法, 其
特征在于, 故障场景文档中词汇的语义相近词列表通过如下 方式获取:
按所述相近程度对不同的中心词 进行排序, 得到故障场景文档中词汇的语义相近词列
表。
11.一种基于海量运维数据和知识的故障场景文档快速匹配装置, 其特征在于, 所述装
置包括:
故障查询语句获取 单元, 用于获取故障查询语句;
数据调取单元, 用于根据所述故障查询语句从故障场景文档数据集中获取目标语义相
近词列表、 所述目标语义相 近词列表中词汇的目标特征、 以及所述 目标语义相 近词列表中
词汇与所述故障场景文档数据集中不同故障场景文档的关键词之间的相似程度;
目标故障场景文档获取单元, 用于根据所述目标特征以及所述相似程度获取目标故障
场景文档。
12.根据权利要求11所述的基于海量运维数据和知识的故障场景文档快速匹配装置,
其特征在于, 所述数据调取 单元包括:
处理模块, 用于对所述故障查询语句进行分词, 得到不同的查询词汇;
调取模块, 用于根据所述查询词汇从故障场景文档数据集中获取目标语义相近词列
表、 所述目标语义相 近词列表中词汇的目标特征、 以及所述 目标语义相 近词列表中词汇与
所述故障场景文档数据集中不同故障场景文档的关键词之间的相似程度。
13.一种处理器, 其特征在于, 被配置成执行权利要求1至10中任意一项所述的基于海
量运维数据和知识的故障场景文档快速匹配方法。
14.一种机器可读存储介质, 该机器可读存储介质上存储有指令, 其特征在于, 该指令
在被处理器执行时使得所述处理器被配置成执行权利要求 1至10中任一项所述的基于海量
运维数据和知识的故障场景文档快速匹配方法。
15.一种计算机程序产品, 包括计算机程序, 其特征在于, 所述计算机程序在被处理器
执行时实现权利要求1至10中任一项 所述的基于海量运 维数据和知识的故障场景文档快速
匹配方法。权 利 要 求 书 2/2 页
3
CN 115470335 A
3
专利 故障场景文档快速匹配方法、装置、存储介质及处理器
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-03-03 12:13:47上传分享