iso file download
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211026058.4 (22)申请日 2022.08.25 (71)申请人 武汉云上融媒科技有限公司 地址 430000 湖北省武汉市中国(湖北)自 贸区光谷三路777号A办公楼4层401- 354号 (72)发明人 王力欧 付全文 陈建荣  (74)专利代理 机构 武汉红观 专利代理事务所 (普通合伙) 42247 专利代理师 赵征友 (51)Int.Cl. G06F 40/284(2020.01) G06F 16/35(2019.01) G06N 20/00(2019.01) G06Q 10/00(2012.01) (54)发明名称 基于用户投诉的汽车故障发现方法、 系统、 设备及介质 (57)摘要 本发明提出了一种基于用户投诉的汽车故 障发现方法、 系统、 设备及介质, 通过获取汽车厂 商信息、 汽车名称信息、 车型信息、 汽车的各种故 障描述文本信息以及关于用户对于各种质量汽 车的投诉文本信息, 对这些文本信息进行文本预 处理, 获取汽车故障和用户投诉的关键分词, 使 用LDA主题模型, 对关键分词进行分类; 基于GBD T 对用户投诉关键分词以及对应的汽车故障关键 分词进行计算, 根据计算结果建立用户投诉数据 的汽车辅助诊断自学习模型; 通过汽 车辅助诊断 自学习模型, 对待诊断汽车质量投诉进行故障诊 断。 本发明实现了在线即时准确地根据车辆状况 描述信息进行汽车故障诊断。 权利要求书3页 说明书8页 附图1页 CN 115455956 A 2022.12.09 CN 115455956 A 1.一种基于用户投诉的汽车故障发现方法, 其特 征在于, 包括以下步骤: S1, 获取汽车厂商信息、 汽车名称信息、 车型信息、 汽车的各种故障描述文本信息以及 关于用户对于各种质量汽车的投诉文本信息, 并存 入语料库; 继续执 行步骤S2; S2, 对所述故障描述文本信息和投诉文本信息进行文本预处理, 获取汽车故障关键分 词和用户投诉关键分词, 建立用户投诉关键分词以及对应的汽车故障关键分词集合; 继续 执行步骤S3; S3, 使用LDA主题模型, 按照常见汽车的十五大系 统、 所属部件 的结构系统以及常见故 障的特征信息 分词, 对关于汽车的所述用户投诉关键分词以及 对应的汽车故障关键 分词进 行分类; 继续执 行步骤S4; S4, 基于GBDT对用户投诉关键分词以及对应的汽车故障关键分词进行计算, 根据计算 结果建立用户投诉数据的汽车辅助诊断 自学习模型; 继续执 行步骤S5; S5, 输入车辆的状况描述信息到所述汽车辅助诊断自学习模型, 对待诊断汽车质量投 诉进行故障诊断。 2.如权利要求1所述的一种基于用户投诉的汽车故障发现方法, 其特征在于, 所述步骤 S2执行之后, 还进行如下操作: 去除重复的关键分词后将所有关键分词构建成一个词条列表; 对于每一个文本信息, 使用词袋模型构建一个向量, 向量的维度与词条列表的维度相 同, 所述向量的值 为所述词条列表中每 个词条在该文本中出现的次数; 将词袋向量 转换为TF ‑IDF权值向量。 3.如权利要求2所述的一种基于用户投诉的汽车故障发现方法, 其特征在于, 所述将词 袋向量转换为TF ‑IDF权值向量, 具体包括: 计算每个关键分词的特 征权重: W(t,d)表示关键分词t在文本信息d中的权重, tf(t,d)表示关键分词t在文本信息d中 的词频, N为语料库中文本信息d的总数, nt为语料库中包含关键分词t的文本信息数, W(wk, ci)表示词语wk关于类别ci的类别权重, wk表示第k个词, ci表示第i类文本信息; 根据关键分 词的特征权重得到该关键分词的TF ‑IDF权值向量。 4.如权利要求2所述的一种基于用户投诉的汽车故障发现方法, 其特征在于, 所述步骤 S3具体包括: 使用主题模型LDA对所述关于汽车的用户投诉关键分词以及对应的汽车故障关键分词 进行建模分析, 根据困惑度和一致性指标对主题个数K进行超参数调优, 选取最佳的主题个 数K; 利用训练好的LDA模型获取文档信息的主题分布矩阵和主题的单词分布矩阵, 将所述 用户投诉关键 分词以及 对应的汽车故障关键分词根据汽车系统和部件进 行分类, 将分类结 果作为训练样本, 建立多层次、 多维度训练集; 所述主题分布矩阵为N*K, N表示文档个数, K 表示主题个数, 每一行对应一篇文档的主题分布; 所述主题的单词分布矩阵为|V|*K, |V|表 示词汇表大小, K表示主题个数, 每一列对应一个主题的单词分布。权 利 要 求 书 1/3 页 2 CN 115455956 A 25.如权利要求4所述的一种基于用户投诉的汽车故障发现方法, 其特征在于, 所述步骤 S4具体包括: S4‑1, 初始化弱学习器: 其中x为输入向量即关键分词; y为输出变量即关键分词对应的故障类型; 给定由x和y 组成n个训练样本(x1,y1),(x2,y2),…(xn,yn),; γ为梯度下降步长; L(yi,γ)为损失函数, L (yi,γ)=|yi‑γ|; argminγ表示其后面式子 达到最小值时变量yi和γ的取 值, i=1,2,…,n; S4‑2, 对迭代轮数m=1,2, …,M, 对每个样本i=1,2,…,n, 计算残差rim: 将得到的残差作为样本新的真实值, 并将数据(xi,rim), i=1,2, …,n, 作为下棵树的训 练数据, 得到一颗新的回归树fm(x), 其对应的叶子节点区域为Rjm; j=1,2, …,J; J为回归树 fm(x)的叶子节点的个数; 对叶子区域j=1,2, …,J计算最佳拟合 值: S4‑3, 根据步骤S4 ‑1和S4‑2更新强学习器: 其中I取值 为1或者‑1, 表示是否落在对应的叶子节点上, 是则取1, 否则取 ‑1; S4‑4, 得到迭代轮数为M的强学习器为: 通过GBDT算法实现多次迭代, 完成梯度提升决策树叶子节点即关键分词的分类, 完成 汽车辅助诊断 自学习模型的建立。 6.如权利要求5所述的一种基于用户投诉的汽车故障发现方法, 其特征在于, 所述步骤 S4执行完后, 还进行如下操作: 采用所述训练集对所述汽车辅助诊断 自学习模型进行训练。 7.如权利要求1所述的一种基于用户投诉的汽车故障发现方法, 其特征在于, 所述步骤 S5具体包括: 首先将所述车辆的状况描述信息进行包括分词、 去除停用词、 筛选重复词的预处理, 然 后输入到所述汽车辅助诊断自学习模型, 通过对其进行分类确定该待诊断车辆的故障类 型, 完成故障诊断。权 利 要 求 书 2/3 页 3 CN 115455956 A 3

.PDF文档 专利 基于用户投诉的汽车故障发现方法、系统、设备及介质

文档预览
中文文档 13 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于用户投诉的汽车故障发现方法、系统、设备及介质 第 1 页 专利 基于用户投诉的汽车故障发现方法、系统、设备及介质 第 2 页 专利 基于用户投诉的汽车故障发现方法、系统、设备及介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 02:14:26上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。