(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211026058.4
(22)申请日 2022.08.25
(71)申请人 武汉云上融媒科技有限公司
地址 430000 湖北省武汉市中国(湖北)自
贸区光谷三路777号A办公楼4层401-
354号
(72)发明人 王力欧 付全文 陈建荣
(74)专利代理 机构 武汉红观 专利代理事务所
(普通合伙) 42247
专利代理师 赵征友
(51)Int.Cl.
G06F 40/284(2020.01)
G06F 16/35(2019.01)
G06N 20/00(2019.01)
G06Q 10/00(2012.01)
(54)发明名称
基于用户投诉的汽车故障发现方法、 系统、
设备及介质
(57)摘要
本发明提出了一种基于用户投诉的汽车故
障发现方法、 系统、 设备及介质, 通过获取汽车厂
商信息、 汽车名称信息、 车型信息、 汽车的各种故
障描述文本信息以及关于用户对于各种质量汽
车的投诉文本信息, 对这些文本信息进行文本预
处理, 获取汽车故障和用户投诉的关键分词, 使
用LDA主题模型, 对关键分词进行分类; 基于GBD T
对用户投诉关键分词以及对应的汽车故障关键
分词进行计算, 根据计算结果建立用户投诉数据
的汽车辅助诊断自学习模型; 通过汽 车辅助诊断
自学习模型, 对待诊断汽车质量投诉进行故障诊
断。 本发明实现了在线即时准确地根据车辆状况
描述信息进行汽车故障诊断。
权利要求书3页 说明书8页 附图1页
CN 115455956 A
2022.12.09
CN 115455956 A
1.一种基于用户投诉的汽车故障发现方法, 其特 征在于, 包括以下步骤:
S1, 获取汽车厂商信息、 汽车名称信息、 车型信息、 汽车的各种故障描述文本信息以及
关于用户对于各种质量汽车的投诉文本信息, 并存 入语料库; 继续执 行步骤S2;
S2, 对所述故障描述文本信息和投诉文本信息进行文本预处理, 获取汽车故障关键分
词和用户投诉关键分词, 建立用户投诉关键分词以及对应的汽车故障关键分词集合; 继续
执行步骤S3;
S3, 使用LDA主题模型, 按照常见汽车的十五大系 统、 所属部件 的结构系统以及常见故
障的特征信息 分词, 对关于汽车的所述用户投诉关键分词以及 对应的汽车故障关键 分词进
行分类; 继续执 行步骤S4;
S4, 基于GBDT对用户投诉关键分词以及对应的汽车故障关键分词进行计算, 根据计算
结果建立用户投诉数据的汽车辅助诊断 自学习模型; 继续执 行步骤S5;
S5, 输入车辆的状况描述信息到所述汽车辅助诊断自学习模型, 对待诊断汽车质量投
诉进行故障诊断。
2.如权利要求1所述的一种基于用户投诉的汽车故障发现方法, 其特征在于, 所述步骤
S2执行之后, 还进行如下操作:
去除重复的关键分词后将所有关键分词构建成一个词条列表;
对于每一个文本信息, 使用词袋模型构建一个向量, 向量的维度与词条列表的维度相
同, 所述向量的值 为所述词条列表中每 个词条在该文本中出现的次数;
将词袋向量 转换为TF ‑IDF权值向量。
3.如权利要求2所述的一种基于用户投诉的汽车故障发现方法, 其特征在于, 所述将词
袋向量转换为TF ‑IDF权值向量, 具体包括:
计算每个关键分词的特 征权重:
W(t,d)表示关键分词t在文本信息d中的权重, tf(t,d)表示关键分词t在文本信息d中
的词频, N为语料库中文本信息d的总数, nt为语料库中包含关键分词t的文本信息数, W(wk,
ci)表示词语wk关于类别ci的类别权重, wk表示第k个词, ci表示第i类文本信息; 根据关键分
词的特征权重得到该关键分词的TF ‑IDF权值向量。
4.如权利要求2所述的一种基于用户投诉的汽车故障发现方法, 其特征在于, 所述步骤
S3具体包括:
使用主题模型LDA对所述关于汽车的用户投诉关键分词以及对应的汽车故障关键分词
进行建模分析, 根据困惑度和一致性指标对主题个数K进行超参数调优, 选取最佳的主题个
数K;
利用训练好的LDA模型获取文档信息的主题分布矩阵和主题的单词分布矩阵, 将所述
用户投诉关键 分词以及 对应的汽车故障关键分词根据汽车系统和部件进 行分类, 将分类结
果作为训练样本, 建立多层次、 多维度训练集; 所述主题分布矩阵为N*K, N表示文档个数, K
表示主题个数, 每一行对应一篇文档的主题分布; 所述主题的单词分布矩阵为|V|*K, |V|表
示词汇表大小, K表示主题个数, 每一列对应一个主题的单词分布。权 利 要 求 书 1/3 页
2
CN 115455956 A
25.如权利要求4所述的一种基于用户投诉的汽车故障发现方法, 其特征在于, 所述步骤
S4具体包括:
S4‑1, 初始化弱学习器:
其中x为输入向量即关键分词; y为输出变量即关键分词对应的故障类型; 给定由x和y
组成n个训练样本(x1,y1),(x2,y2),…(xn,yn),; γ为梯度下降步长; L(yi,γ)为损失函数, L
(yi,γ)=|yi‑γ|; argminγ表示其后面式子
达到最小值时变量yi和γ的取
值, i=1,2,…,n;
S4‑2, 对迭代轮数m=1,2, …,M, 对每个样本i=1,2,…,n, 计算残差rim:
将得到的残差作为样本新的真实值, 并将数据(xi,rim), i=1,2, …,n, 作为下棵树的训
练数据, 得到一颗新的回归树fm(x), 其对应的叶子节点区域为Rjm; j=1,2, …,J; J为回归树
fm(x)的叶子节点的个数; 对叶子区域j=1,2, …,J计算最佳拟合 值:
S4‑3, 根据步骤S4 ‑1和S4‑2更新强学习器:
其中I取值 为1或者‑1, 表示是否落在对应的叶子节点上, 是则取1, 否则取 ‑1;
S4‑4, 得到迭代轮数为M的强学习器为:
通过GBDT算法实现多次迭代, 完成梯度提升决策树叶子节点即关键分词的分类, 完成
汽车辅助诊断 自学习模型的建立。
6.如权利要求5所述的一种基于用户投诉的汽车故障发现方法, 其特征在于, 所述步骤
S4执行完后, 还进行如下操作:
采用所述训练集对所述汽车辅助诊断 自学习模型进行训练。
7.如权利要求1所述的一种基于用户投诉的汽车故障发现方法, 其特征在于, 所述步骤
S5具体包括:
首先将所述车辆的状况描述信息进行包括分词、 去除停用词、 筛选重复词的预处理, 然
后输入到所述汽车辅助诊断自学习模型, 通过对其进行分类确定该待诊断车辆的故障类
型, 完成故障诊断。权 利 要 求 书 2/3 页
3
CN 115455956 A
3
专利 基于用户投诉的汽车故障发现方法、系统、设备及介质
文档预览
中文文档
13 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 02:14:26上传分享