iso file download
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211032385.0 (22)申请日 2022.08.26 (71)申请人 中国科学技术大学 地址 230026 安徽省合肥市包河区金寨路 96号 (72)发明人 陈恩红 刘淇 曹卫 张琨  阮书岚 陶汉卿 王皓 赵思蕊  (74)专利代理 机构 北京凯特来知识产权代理有 限公司 1 1260 专利代理师 郑立明 韩珂 (51)Int.Cl. G06F 16/35(2019.01) G06F 16/33(2019.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 文本情感原因识别方法、 系统、 设备及存储 介质 (57)摘要 本发明公开了一种文本情感原因识别方法、 系统、 设备及存储介质, 针对情感因果文本蕴含 的因果叙述信息, 运用深度神经网络的语义建模 技术, 并融合注意力机制, 建模文档的因果叙述 信息并学习因果叙述下的原因和结果之间的因 果关联, 从而准确认知情感因果文本的情感因果 语义, 识别文本的情感原因, 弥补了现有的文本 原因识别研究中没有考虑文本的因果叙述信息 的不足。 权利要求书3页 说明书9页 附图3页 CN 115391534 A 2022.11.25 CN 115391534 A 1.一种文本情感原因识别方法, 其特 征在于, 包括: 根据文档中已知的情感短语标记情感结果子句, 并利用预训练语言模型将文档的各个 子句进行矢量 化, 获得文档的向量 化语义表示 集合; 通过结果感知的情感注意力单元, 结合文档的向量化语义表示集合, 挖掘情感结果子 句与其它子句之间的情感因果关联, 初步理解文本的情感因果关系, 获得文档的蕴含情绪 因果关联信息的文本表示 集合; 通过叙述感知的因果关联单元, 利用因果叙事的语义连贯性学习文档 中因果叙事, 基 于文档的蕴含情绪因果关联信息的文本表示 集合, 获得文档的因果叙 事表征集 合; 通过结果感知的情感注意力单元, 结合文档的因果叙事表征集合, 重新认知情感结果 子句与其它子句之间的情感因果关联, 获得重新认知后的文本表示 集合; 基于所述重新认知后的文本表示 集合进行情感原因子句预测。 2.根据权利要求1所述的一种 文本情感原因识别方法, 其特征在于, 所述根据文档中已 知的情感短语标记情感结果子句, 并利用预训练语言模型将文档的各个子句进行矢量化, 获得文档的向量 化语义表示 集合包括: 给定一个文档D和情感短语ep, 其中, 情感短语ep为文档D的整体情感标签, 在文档D 中, 与情感短语ep的情感一致的子句即为情感结果子句; 将文档D的子句数目记为n, 情感结果 子句为第k个子句, 则文档D的形式为: 其中, c表示 一个子句, 下 标为子句的序号, 表示情感结果子句, k∈(1,n); 将文档D输入至预训练语言模型, 获得文档的向量 化语义表示 集合: 其中, Eb表示文档的向量化语 义表示集合, x为一个子句的向量化语 义表示, 为情感结 果子句 的向量化语义表示。 3.根据权利要求1所述的一种 文本情感原因识别方法, 其特征在于, 所述通过结果感知 的情感注意力单元, 结合文档的向量化语义表示集合, 挖掘情感结果子句与其它子句之间 的情感因果关联, 初步理解文本的情感因果关系, 获得文档的蕴含情绪因果关联信息的文 本表示集合的步骤 包括: 使用双向长短时记忆网络对文档的向量化语义表示集合进行处理, 获得所有子句的带 有上下文信息的表征集合Eh, h表示一个子句带有上下 文信息的表征, 下 标为子句的序号, 表示情感结果子句的带有上 下文信息的表征; 使用注意力 机制挖掘情感结果子句与其它子句之间的情感因果关联, 获得每一其它子 句与情感结果子句的注意力权 重分数, 表示 为: 权 利 要 求 书 1/3 页 2 CN 115391534 A 2其中, W1, W2和W3表示结果感知的情感注意力单元中可训练的参数, 矩阵M为一个中间变 量; 表示注意力权 重分数向量, 包 含每一其它子句与情感结果子句的注意力权 重分数; 将注意力权重分数向量 与所有子句的带有上下文信息的表征集合Eh, 获得文档的蕴 含情绪因果关联信息的文本表示 集合。 4.根据权利要求1所述的一种 文本情感原因识别方法, 其特征在于, 通过叙述感知的因 果关联单元, 利用因果叙事的语义连贯性学习文档中因果叙事, 基于文档的蕴含情绪因果 关联信息的文本表示 集合, 获得文档的因果叙 事表征集 合的步骤 包括: 根据因果叙事的特点, 按照情感结果子句所在位置, 将文档划分为前后两个候选原因 区域; 分别将情感结果子句与前后两个候选原因区域的因果叙事信 息进行建模, 获得两个因 果叙述关联信息, 将两个因果叙述关联信息进行整合, 获得文档的因果叙 事关联向量r; 将因果叙事关联向量r整合到文档的蕴含情绪因果关联信息的文本表示集合中, 获得 文档的因果叙 事表征集 合Ec, 表示为: Ec=r·W4Eu 其中, Eu表示文档的蕴含情绪 因果关联信息的文本表示集合, W4表示叙述感知的因果关 联单元中可训练的参数。 5.根据权利要求4所述的一种 文本情感原因识别方法, 其特征在于, 所述分别将情 感结 果子句与前后两个候选原因区域的因果叙事信息进行建模, 获得两个因果叙述关联信息, 将两个因果叙述关联信息进行整合, 得到文档的因果叙 事关联向量包括: 前后两个候选原因区域包括: 第1个子句至第k个子句的区域, 称为第1个候选原因区 域; 第k个子句到第n个子句的区域, 称为第2个候选原因区域; 其中, 第k个子句为情感结果 子句, n为文档的子句数目; 根据前后两个候选原因区域从文档的蕴含情绪因果关联信息的文本表示中获得相应 的文本表示, 记为第一序列 与第二序列 s表示一个子句蕴 含情绪因果关联信息的文本表示, 来自所述文档的蕴含情绪因果关联信息的文本表示, 下 标为子句的序号, 表示情感结果子句蕴含情绪因果关联信息的文本表示; 去掉第一序列的最后一个元素获得第 一子序列, 去掉第 二序列的第 一个元素获得第 二 子序列, 利用长短时记忆网络分别对第一子序列与第二子序列进行处理, 将长短时记忆网 络最后一个时间步的输出作为每一子序列的整体 语义表示; 对于每一子序列, 分别计算相应的整体语义表示与情 感结果子句蕴含情绪因果关联信 息的文本表示的相似度, 将相似度作为子序列所属序列的因果叙述关联信息, 每一序列对 应的因果叙述关联信息的长度等同于序列长度, 因果叙述关联信息中的每一元素等于相应 的相似度; 通过复制和填充操作将两个序列对应的因果叙述关联信息转换为同等维度的向量形 式, 再通过 取均值的方式进行整合, 获得文档的因果叙 事关联向量。 6.根据权利要求1所述的一种 文本情感原因识别方法, 其特征在于, 所述基于所述重新 认知后的文本表示 集合进行情感原因子句预测包括: 将所述重新认知后的文本表示集合中每个子句对应的重新认知后的文本表示依次输权 利 要 求 书 2/3 页 3 CN 115391534 A 3

.PDF文档 专利 文本情感原因识别方法、系统、设备及存储介质

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 文本情感原因识别方法、系统、设备及存储介质 第 1 页 专利 文本情感原因识别方法、系统、设备及存储介质 第 2 页 专利 文本情感原因识别方法、系统、设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 02:15:27上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。