iso file download
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211145422.9 (22)申请日 2022.09.20 (71)申请人 内蒙古工业大 学 地址 010080 内蒙古自治区呼和浩特市土 默特左旗内蒙古工业大 学金川校区 (72)发明人 苏依拉 赵梦莹 仁庆道尔吉  吉亚图 乌尼尔 路敏  (74)专利代理 机构 西安智大知识产权代理事务 所 61215 专利代理师 段俊涛 (51)Int.Cl. G06F 16/35(2019.01) G06F 40/30(2020.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种基于多维特征融合与比较增强学习机 制的蒙古语情感分析方法 (57)摘要 一种基于多维特征融合与比较增强学习机 制的蒙古语情感分析方法, 对蒙古情感语料进行 预处理, 将预处理后的蒙古语情感语料进行多维 特征表示, 然后进行多维特征注 意力融合得到融 合特征矩阵F; 从F中抽取出主题词库, 经过CNN模 型训练得到主题特征向量S; 将F与 S输入到TBGRU 模型中获取文本语义信息R; 将R与S的共同语义 特征进行注意力融合; 根据融合结果, 使用比较 增强学习机制获取文本情感分类信息。 本发明能 够实现对蒙古语文本的精确情感分析。 权利要求书3页 说明书6页 附图2页 CN 115510230 A 2022.12.23 CN 115510230 A 1.一种基于多维特征融合与比较增强学习机制的蒙古语情感分析方法, 其特征在于, 包括如下步骤: 步骤1, 对蒙古情感语料进行预处理, 将预处理后的蒙古语情感语料进行多维特征表 示, 然后进行多维特 征注意力融合得到融合特 征矩阵F; 步骤2, 从所述融合特征矩阵F中抽取出主题词库, 经过CNN模型训练得到主题特征向 量; 步骤3, 将所述融合特征矩阵F与所述主题特征向量输入到TBGRU模型中获取文本语义 信息; 步骤4, 将TBGRU模型的输出结果与所述主题特征向量的共同语义特征进行注意力融 合; 步骤5, 根据融合结果, 使用比较增强学习机制获取文本情感分类信息 。 2.根据权利要求1所述基于多维特征融合与比较增强学习机制的蒙古语情感分析方 法, 其特征在于, 所述 步骤1, 预处 理包括: 数据清洗和分词。 3.根据权利要求1所述基于多维特征融合与比较增强学习机制的蒙古语情感分析方 法, 其特征在于, 所述多维特征表示, 是将语料中情感词的词性、 词与词的位置关系以及句 法依存关系特 征加入词向量中, 以从多维度层面挖掘出文本语义隐含的更深层次的信息; 设句子中第t个单词的词向量为et, 同时将第t个单词对应的词性特征向量、 位置 特征向 量和句法依存 特征向量分别设为st、 tt、 qt, 将句子中的单词拼接在一起, 每个特征向量矩阵 表示的具体方法如下公式所示: 其中, a表示句子的长度, 1≤t≤a, c、 d、 b和k分别表示词向量矩阵、 词性特征向量矩阵、 位置特征向量矩阵和句法依存特征向量矩阵的维度, Pc、 Pd、 Pb和Pk分别表示该句子的词、 词 性、 位置和句法依存特征向量拼接矩阵, 表示向量拼接操作, 进行多维特征表示之后输 出的矩阵为y, y=Pc+Pd+Pb+Pk; 所述多维特 征注意力融合, 计算方法如下 所示: M(yi)=tanh(Wyi+b) 其中, tanh表示激活函数, yi表示矩阵y中的第i个向量, M(yi)表示向量yi对应特征的权权 利 要 求 书 1/3 页 2 CN 115510230 A 2重, W表示权重矩阵, b表示偏置矩阵, βi表示M(yi)经过SoftMax的输出, fi表示第i个单词的 融合特征向量; n表示矩阵y中向量的个数; 融合特征矩阵F表示为F=[f1, f2, ..., fi, ..., fn]。 4.根据权利要求3所述基于多维特征融合与比较增强学习机制的蒙古语情感分析方 法, 其特征在于, 所述步骤2, 在融合特征矩阵F中, 选用SS ‑LDA, 将一个句子中出现的多个方 面主题均提取出来, 组成主题词库s=[s1、 s2、 ...、 si、 ...、 sm], 其中, si表示第i个主题词, m 表示主题词的个数; 将主题词库s输入到CNN模型中, 通过卷积和池化操作提取主题特征u, 公式如下 所示: u=frelu(s*Wu+bu) 其中, frelu表示激活函数, Wu是c*m的卷积核, bu是偏置值; 采用最大池化方法对主题特征u进行采样, 得到主题特征向量S=[S1、 S2、 ...、 Si、 ...、 SM], 其中, Si表示采样后得到的第i个主题特 征, M表示经 过采样后得到的主题特 征的个数。 5.根据权利要求4所述基于多维特征融合与比较增强学习机制的蒙古语情感分析方 法, 其特征在于, 所述步骤3, TBGRU模 型是在GRU模 型基础上嵌入了主题特征向量, 将融合特 征矩阵F输入到所述TBGRU模 型中, 同时将主题特征向量嵌入到TBGRU模 型中进行模 型训练, 在模型训练过程中添加注意力进行权值分配, 得到文本语义信息表示。 6.根据权利要求5所述基于多维特征融合与比较增强学习机制的蒙古语情感分析方 法, 其特征在于, 所述 步骤3的流 程如下: (1)将融合特征矩阵F输入到TBGRU模型中, 使用双向GRU对融合特征矩阵F进行编码, 输 入的每个单词隐藏状态hi由前向隐藏状态和后向隐藏状态连接表示, 获取以hi为中心的整 个句子的上 下文信息; (2)将主题特征向量S 嵌入到TB GRU模型中, 使用MLP计算hi的投影vi, 计算vi和Si的点积 生成主题特征向量对应于融合 特征向量位置信息的嵌入 权值βi, 最终输出主题嵌入pi, 计算 方法如下公式所示: vi=tanh(Wahi) βi=softmax(viSi) 其中, Wa表示权重矩阵, 表示为标量和向量的乘积; (3)将pi嵌入双向GRU公式 中, 将原始双向GRU公式更改为如下公式所示: qi=σ(Wqfi+Uqhi‑1+Vqpi‑1) zi=σ(Wzfi+Uzhi‑1+Vzpi‑1) 其中, σ(·)表示sigmoid函数, Wq、 Wz、 Wh、 Uq、 Uz、 Uh、 Vq、 Vz、 Vh均为权重矩阵, 是通过模型 学习的网络参数, 区别在于维度不同; ⊙表示向量间 的乘积, qi表示重置门, zi表示更新门, hi表示前一个隐藏状态hi‑1和当前权 利 要 求 书 2/3 页 3 CN 115510230 A 3

PDF文档 专利 一种基于多维特征融合与比较增强学习机制的蒙古语情感分析方法

文档预览
中文文档 12 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于多维特征融合与比较增强学习机制的蒙古语情感分析方法 第 1 页 专利 一种基于多维特征融合与比较增强学习机制的蒙古语情感分析方法 第 2 页 专利 一种基于多维特征融合与比较增强学习机制的蒙古语情感分析方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:13:47上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。