iso file download
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211216941.X (22)申请日 2022.09.30 (71)申请人 香港中文大 学深圳研究院 地址 518000 广东省深圳市南 山区虚拟大 学园区粤兴二道10号 (72)发明人 吕荣聪 霍茵桐 李柏橦 苏玉鑫 刘金杨 (74)专利代理 机构 深圳新创友知识产权代理有 限公司 4 4223 专利代理师 江耀锋 (51)Int.Cl. G06F 11/36(2006.01) G06F 16/35(2019.01) G06F 40/30(2020.01) (54)发明名称 一种基于日志的根因分析系统 (57)摘要 本发明公开了一种基于日志的根因分析系 统, 包括: 多层特征提取器, 用于从日志中提取多 极特征, 以捕捉类似日志中的高层次共性; 根因 定位器, 用于接收多层特征提取器提取的特征, 以无监督的方式自动定位故障。 还公开了一种基 于日志的根因分析方法, 包括步骤: S1语言模型 微调; S2常态特征提取; S3 未知日志特征提取; S4 异常分数计算; S5结果输出。 本发明可以规避日 志解析器的误导, 可以避免将正常的演化事件识 别为根因, 大幅提高识别精准率; 本发明采用一 个由两个子定位器构成的根因定位器, 分析中心 日志是否异常, 并结合其上下文(即整体序列)综 合分析中心日志是否异常, 从而准确地识别出异 常序列。 权利要求书2页 说明书8页 附图1页 CN 115543802 A 2022.12.30 CN 115543802 A 1.一种基于日志的根因分析系统, 其特 征在于, 包括: 多层特征提取器, 用于从日志中提取多极特 征, 以捕捉类似日志中的高层次共性; 根因定位器, 用于 接收多层特 征提取器提取的特 征, 以无监 督的方式自动定位故障。 2.根据权利要求1所述的基于日志的根因分析系统, 其特 征在于, 所述多层特 征提取器提取的特 征包括单 条日志的语义表征, 具体提取 方式为: 用大型语料库对大型自然语言处理模型LLPM进行训练, 并采用对比学习对LLPM进行微 调, 利用微调后的L LPM提取单条日志的语义表征。 3.根据权利要求2所述的基于日志的根因分析系统, 其特 征在于, 所述对比学习具体为, 为了构建相似的日志对, 通过两次应用dropout功能将一个日志 送入LPLM以获得两个不同的嵌入, 在批训练背景下, 将同一批中的其他日志被认为是不相 似的对。 4.根据权利要求2所述的基于日志的根因分析系统, 其特 征在于, 所述多层特征提取器提取的特征还包括抽象表征, 具体提取方式为: 建立一个基于密 度的方法对所述信息表征进行层次聚类得到抽象表征。 5.根据权利要求 4所述的基于日志的根因分析系统, 其特 征在于, 所述基于密度的方法为HDBSCAN。 6.根据权利要求 4所述的基于日志的根因分析系统, 其特 征在于, 在层次聚类过程中, 利用主成分 分析降低输入表示的维度, 提高算法的效率。 7.根据权利要求1所述的基于日志的根因分析系统, 其特 征在于, 所述根因定位器包括一个局部定位器, 其使用当前检测窗口的中心日志及其上下文来 获取针对不稳定序列的局部特征, 然后学习这种局部特征 的常态, 即学习系统正常无故障 运行状态下的上 下文常态, 其中所述中心日志为当前待检测日志。 8.根据权利要求7 所述的基于日志的根因分析系统, 其特 征在于, 所述根因定位器还包括一个单位定位器, 其学习单个日志 的单位特征, 即学习单个日 志的常态, 得到常态单位特 征和常态上 下文特征。 9.根据权利要求8所述的基于日志的根因分析系统, 其特 征在于, 所述以无监 督的方式自动定位故障具体为: 首先, 单位定位器计算出当前检测的日志的单位特征和常态单位特征的差值, 记为 abnScoreuni; 然后, 局部定位器计算出当前日志的上下文特征和常态上下文特征的差值, 记为 abnScorelocal; 两个定位器计算出的异常分数的加权和为λ ×abnScoreuni+(1‑λ)× abnScorelocal, 参数 λ是 人工定义的参数, 取值 为0~1; 如果异常分数的加权和大于人工预设的阈值D, 则判定为异常, 即标记当前日志为根因 并输出。 10.一种基于日志 的根因分析方法, 其特征在于, 使用根据权利要求1 ‑9任一项所述的 基于日志的根因分析系统, 包括如下步骤: S1、 语言模型微调: 使用正常状态下的日志文本对已经预训练好的LLPM进行微调, 即只 改变语言模型最下游几层网络的权值; S2、 常态特征提取: 输入正常状态下的文本到所述特征提取器 中, 每条日志本身及其上权 利 要 求 书 1/2 页 2 CN 115543802 A 2下文日志分别通过多层特征提取器, 并通过对比学习提取系统在正常运行下生成的日志的 特征, 即常态特征, 包括单位常态特 征和上下文常态特 征, 同时训练本发明提出的模型; S3、 未知日志特征提取: 输入待检测的日志文件, 重复步骤S2, 通过多层特征提取器提 取当前日志特 征, 包括单位特 征和上下文特征; S4、 异常分数计算: 将步骤S2和步骤S3中的单位常态特征和单位特征、 上下文常态特征 和上下文特征分别进行比较并计算距离, 再计算距离的加权和, 作为待检测日志的异常分 数; S5、 结果输出: 如果步骤S4中得到的异常分数大于人工预先定义的阈值, 则标记此日志 为根因并输出, 否则 则将此日志视为 正常日志, 不予标记。权 利 要 求 书 2/2 页 3 CN 115543802 A 3
专利 一种基于日志的根因分析系统
文档预览
中文文档
12 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助3元下载(无需注册)
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助3元下载
本文档由 SC 于
2024-03-03 12:13:40
上传分享
举报
下载
原文档
(513.9 KB)
分享
友情链接
T-CERDS 2—2022 企业ESG披露指南.pdf
T-CFA 0310021—2023 铸造企业规范条件.pdf
JR-T 0083-2013 人身保险伤残评定标准及代码.pdf
专利 一种知识图谱更新方法、装置、设备及存储介质.PDF
关键信息基础设施安全保护条例.pdf
备份与恢复管理制度.pdf
GB-T 14272-2021 羽绒服装.pdf
人工智能大模型体验报告3.0.pdf
DL-T 884-2019 火电厂金相检验与评定技术导则.pdf
Cisco防火墙安全配置基线.doc
GB 3096-2008_声环境质量标准.pdf
GB-T 32570-2016 集装箱用钢板及钢带.pdf
思度安全-DSMM-008 数据分类分级管理规范V1.0.pdf
GB-T 30520-2014 会议分类和术语.pdf
GB-T 4423-2020 铜及铜合金拉制棒.pdf
DB65-T 4529—2022 三相异步电动机节能监测 新疆维吾尔自治区.pdf
T-ZZB 2304—2021 辐射致 制 冷膜.pdf
GB-T 26429-2022 设备工程监理规范.pdf
QC-T 556-2023 汽车制动器温度测量方法及热电偶安装要求.pdf
信通院 人工智能数据安全白皮书.pdf
1
/
12
评价文档
赞助3元 点击下载(513.9 KB)
回到顶部
×
微信扫码支付
3
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。