iso file download
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210904343.5 (22)申请日 2022.07.29 (71)申请人 红塔烟草 (集团) 有限责任公司 地址 653100 云南省玉 溪市红塔区红塔大 道118号 (72)发明人 张介 戴妮理 赵利明 杨家荣  (74)专利代理 机构 北京隆达恒晟知识产权代理 有限公司 1 1899 专利代理师 李中强 (51)Int.Cl. G06K 9/62(2022.01) G06Q 10/00(2012.01) G06Q 50/04(2012.01) (54)发明名称 一种故障记录分类方法 (57)摘要 本发明涉及一种故障记录分类方法, 属于烟 草MES自动化设备管理技术领域。 所述的故障记 录分类方法包括利用常用语言对故障记录进行 关键词代替、 强化设备部位分类的文本强化方 法、 权重化文本编辑距离算法达到对类似口语的 模糊记录故障信息的自动分类。 本发 明能够在经 验的基础上, 以较少的样本分类MES故障维护记 录, 且算法稳定, 自动分类故障, 将不同管理体系 下的信息分类, 将计算出的编辑距离总和作为分 类依据, 排序后的最大值对应的目标分类系统的 中部位名称作为分类的结果, 提高故障记录识别 的准确率。 权利要求书1页 说明书5页 附图1页 CN 115422991 A 2022.12.02 CN 115422991 A 1.一种故障记录分类方法, 其特征在于: 所述的故障记录分类方法包括利用常用语言 对故障记录进行关键词代替、 强化设备部位分类的文本强化方法、 权重化文本编辑距离算 法达到对类似口语的模糊记录故障信息的自动分类; 所述的故障记录分类方法通过经验的关键词替代与权重化的Jaro ‑Winkler距离来确 定MES维护记录与关键功能点 位控制中相应位置, 算法流 程为: 故障记录一般的异常字符处 理; 半经验的对设备、 材 料的常用称呼统一 为关键功能点 位中的统一关键词; 用一些Jaro ‑Winkler距离为0的关键 字代替设备名称; 分别记录维护记录内容与原来分类名称的Jaro ‑Winkler距离; 将此各距离项 按权重相加; 按权重合并值 排序, 确定最终分类。 2.根据权利要求1所述的一种故障记录分类方法, 其特征在于: 所述的利用常用语言对 故障记录进行关键词代替方法为: 将与设备所用材料、 设备上部位名称相关的口语中常用 的很多通用说法全部替代为设备关键功 能位置管理系统或者配件生命周期管理系统中的 统一名称, 或将各记录中都有的设备名称等信息统一去掉。 3.根据权利要求1或2所述的一种故障记录分类方法, 其特征在于: 所述的强化设备部 位分类的文本强化方法为: 将不同设备上的使用的相似部 分名称用对后面分类算法来说差 异非常大的名称短语代替。 4.根据权利要求1或2所述的一种故障记录分类方法, 其特征在于: 所述的权重化文本 编辑距离算法达到对类似口语的模糊记录故障信息的自动分类为: 在原来一般Jaro ‑ Winkler编辑距离算法基础上, 使用故障记录中原系统部位名称、 故障描述与目标分类系统 中各部位名称分别计算Jaro ‑Winkler编辑距离, 并按2.5/4、 1.5/4的权重系数计算编辑距 离总和。 5.根据权利要求1或2所述的一种故障记录分类方法, 其特征在于: 权重化的Jaro ‑ Winkler距离算法包括将目标分类名称与 故障记录系统中的多个信息项, 按一定的权重来 量化、 排序, 并确定最匹配的分类项, 将计算出 的编辑距离总和作为分类依据, 排序后的最 大值对应的目标分类系统的中部位名称作为分类的结果, 提高故障记录识别的准确率。 6.根据权利 要求4所述的一种故障记录分类方法, 其特征在于: 权重化的Jaro ‑Winkler 距离算法包括将目标分类名称与故障记录系统中的多个信息项, 按一定的权重来量化、 排 序, 并确定最匹配的分类项, 将 计算出的编辑距离总和作为分类依据, 排序后的最大值对应 的目标分类系统的中部位名称作为分类的结果, 提高故障记录识别的准确率。权 利 要 求 书 1/1 页 2 CN 115422991 A 2一种故障记录分类方 法 技术领域 [0001]本发明属于烟草MES自动化设备管理技术领域, 具体的说, 涉及一种故障记录分类 方法。 背景技术 [0002]烟草MES系统管理中涉及了设备维修过程中相关记录, 包括设备故障部位、 故障描 述等, 为将此类信息用于配件生命周期管理和设备关键功 能点位控制等, 需要将人工记录 地模糊的MES维护记录与相应的设备关键功能管理位置对应, 但是MES记录存在模糊性, 且 由于样本数量不多, 不足以使用较为复杂自动分类的算法, 否则将很容易产生数据过拟合 等问题。 [0003]因此, 有必要提供一种故障记录分类方法, 算法稳定, 自动分类故障, 将不同管理 体系下的信息分类。 发明内容 [0004]为了克服背景技术中存在的MES记录存在模糊性, 且由于样本数量不多, 不足以使 用较为复杂自动分类的算法, 否则将很容易产生数据过拟合等问题, 本发明提供了一种故 障记录分类方法, 算法稳定, 自动分类故障, 将不同管理体系下的信息分类。 [0005]为实现上述目的, 本发明是通过如下技 术方案实现的: [0006]本发明提供了一种故障记录分类方法, 包括利用常用语言对 故障记录进行关键词 代替、 强化设备部位分类的文本强化方法、 权重化文本编辑距离算法达到对类似口语的模 糊记录故障信息的自动分类。 [0007]所述的故障记录分类方法通过经验的关键词替代与权重化的Jaro ‑Winkler距离 来确定MES维护记录与关键功能点位控制中相应位置, 算法流程为: 故障记录一般的异常字 符处理; 半经验的对设备、 材料的常用称呼统一为关键功能点位中的统一关键词; 用一些 Jaro‑Winkler距离为0的关键字代替设备名称; 分别记录维护记录内容与原来分类名称的 Jaro‑Winkler距离; 将此 各距离项 按权重相加; 按权 重合并值 排序, 确定最终分类。 [0008]作为优选, 所述的利用常用语言对故障记录进行关键词代替方法为: 将与设备所 用材料、 设备上部位名称相关的口语中常用的很多通用说法全部替代为设备关键功能位置 管理系统或者配件生命周期管理系统中的统一名称。 或将各记录中都有的设备名称等信息 统一去掉。 [0009]作为优选, 所述的强化设备部位分类的文本强化方法为: 将不 同设备上的使用的 相似部分名称用对后面分类算法来说差异非常大的名称短语代替。 [0010]作为优选, 所述的权重化文本编辑距离算法达到对类似口语的模糊记录故障信息 的自动分类为: 在原来一般Jaro ‑Winkler编辑距离算法基础上, 使用故障记录中原系统部 位名称、 故障描述与目标分类系统中各部位名称分别计算Jaro ‑Winkler编辑距离, 并按 2.5/4、 1.5/4的权重系数计算编辑距离总和。说 明 书 1/5 页 3 CN 115422991 A 3

.PDF文档 专利 一种故障记录分类方法

文档预览
中文文档 8 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共8页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种故障记录分类方法 第 1 页 专利 一种故障记录分类方法 第 2 页 专利 一种故障记录分类方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 16:01:22上传分享
友情链接
交流群
  • //public.wenku.github5.com/wodemyapi/22.png
-->
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。