(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211228009.9
(22)申请日 2022.10.09
(71)申请人 中国电信股份有限公司
地址 100033 北京市西城区金融街31号
(72)发明人 张蕾 冉猛 危枫 梁晓东
郭子滔 王晨子
(74)专利代理 机构 北京康信知识产权代理有限
责任公司 1 1240
专利代理师 董文倩
(51)Int.Cl.
G06F 40/295(2020.01)
G06F 40/242(2020.01)
G06F 40/30(2020.01)
G06K 9/62(2022.01)
G06N 3/04(2006.01)G06N 3/08(2006.01)
(54)发明名称
评论文本情感倾向分析方法及装置
(57)摘要
本申请公开了一种评论文本情感倾向分析
方法及装置。 其中, 该方法包括: 获取待分析评论
文本, 并提取待分析评论文本中的多个目标特征
对象; 从预设的特征词典中确定每个目标特征对
象对应的目标特征, 得到目标特征集合; 对于每
个目标特征对象, 基于待分析评论文本、 目标特
征对象和目标特征对象对应的目标特征, 构建目
标特征对象对应的目标特征文本; 分别对每个目
标特征文本进行细粒度情感分析, 得到多个情感
倾向分析子结果; 基于多个情感倾向分析子结果
确定待分析评论文本的目标情感倾向分析结果,
用于反映目标特征集合中每种目标特征的目标
情感倾向极性。 本申请解决了相关技术中无法有
效分析出同一评论文本中的多个不同情感倾向
极性的技 术问题。
权利要求书2页 说明书13页 附图4页
CN 115438668 A
2022.12.06
CN 115438668 A
1.一种评论文本情感倾向分析 方法, 其特 征在于, 包括:
获取待分析评论文本, 并提取 所述待分析评论文本中的多个目标 特征对象;
从预设的特征词典中确定每个所述目标特征对象对应的目标特征, 得到目标特征集
合, 其中, 所述特 征词典中包括多个特 征对象与多个特 征间的映射关系;
对于每个所述目标特征对象, 基于所述待分析评论文本、 所述目标特征对象和所述目
标特征对象对应的目标 特征, 构建所述目标 特征对象对应的目标 特征文本;
分别对每 个所述目标 特征文本进行细粒度情感分析, 得到多个情感倾向分析子结果;
基于所述多个情感倾向分析子结果确定所述待分析评论文本的目标情感倾向分析结
果, 其中, 所述目标情感倾向分析结果用于反映所述 目标特征集合中每种 所述目标特征 的
目标情感倾向极性。
2.根据权利要求1所述的方法, 其特征在于, 提取所述待分析评论文本中的多个目标特
征对象, 包括:
利用预设的特征提取模型提取所述待分析评论文本 中的多个所述目标特征对象, 得到
目标特征对象集 合;
其中, 所述特征提取模型是基于历史评论文本, 通过双 向特征表示的预训练语言模型
以及条件随机场算法训练得到的模型。
3.根据权利要求1所述的方法, 其特征在于, 从预设的特征词典中确定每个所述目标特
征对象对应的目标 特征, 得到目标 特征集合, 包括:
利用预设的特征统一模型从所述特征词典中确定每个所述目标特征对象对应的所述
目标特征, 得到所述目标 特征集合;
其中, 所述特征统一模型中包括文本相似度分析模型和所述特征词典, 所述文本相似
度分析模型 是基于历史评论文本, 通过 卷积神经网络算法训练得到的模型。
4.根据权利要求3所述的方法, 其特征在于, 利用预设的特征统一模型从所述特征词典
中确定每 个所述目标 特征对象对应的所述目标 特征, 包括:
对于任一所述目标特征对象, 利用所述文本相似度分析模型将所述目标特征对象与 所
述特征词典中的多个特 征对象进行比较;
在所述特征词典中存在与 所述目标特征对象相同的第 一特征对象时, 将所述第 一特征
对象对应的特 征作为所述目标 特征对象对应的所述目标 特征;
在所述特征词典中不存在与 所述目标特征对象相同的所述第 一特征对象时, 确定所述
特征词典中与所述目标特征对象相似度最高的第二特征对象, 将所述第二特征对象对应的
特征作为所述目标 特征对象对应的所述目标 特征。
5.根据权利要求1所述的方法, 其特征在于, 对于每个所述目标特征对象, 基于所述待
分析评论文本、 所述 目标特征对 象和所述 目标特征对 象对应的目标特征, 构建所述 目标特
征对象对应的目标 特征文本, 包括:
对于每个所述目标特征对象, 基于所述目标特征对象在所述待分析评论文本中的位
置, 将所述待分析评论文本划分为前半段评论文本和后半段评论文本;
基于所述前半段评论文本、 所述后半段评论文本、 所述目标特征对象和所述目标特征
对象对应的目标 特征, 构建所述目标 特征对象对应的目标 特征文本;
其中, 所述目标特征文本中还包括: 语义表征符、 文本分隔符、 用于反映所述目标特征权 利 要 求 书 1/2 页
2
CN 115438668 A
2对象在所述待分析评论文本中的位置的位置标识符和用于反 映所述目标特征对 象和所述
目标特征间的映射关系的映射关系标识符。
6.根据权利要求1所述的方法, 其特征在于, 分别对每个所述目标特征文本进行细粒度
情感分析, 得到多个情感倾向分析子结果, 包括:
利用预设的情感分析模型分别对每个所述目标特征文本进行细粒度情感分析, 得到多
个情感倾向分析子结果, 其中, 每个所述情感倾向分析子结果中包括多种情感倾向极性的
置信度, 所述情感倾向极性至少包括以下之一: 积极、 中立、 消极;
其中, 所述情感分析模型是基于历史评论文本, 通过双 向特征表示的预训练语言模型
训练得到的模型。
7.根据权利要求6所述的方法, 其特征在于, 基于所述多个情 感倾向分析子结果确定所
述待分析评论文本的目标情感倾向分析 结果, 包括:
对于每个所述目标特征, 确定与所述目标特征对应的多个所述目标特征对象, 分别计
算多个所述目标 特征对象的每种情感倾向极性的置信度的平均值, 得到 置信度结果;
利用归一 化指数函数将所述置信度结果 转化为每种情感倾向极性的概 率分布;
将所述概率分布中概率最大的情感倾向极性作为所述目标特征的所述目标情感倾向
极性。
8.一种评论文本情感倾向分析装置, 其特 征在于, 包括:
获取模块, 用于获取待分析评论文本, 并提取所述待分析评论文本中的多个目标特征
对象;
第一确定模块, 用于从预设的特征词典中确定每个所述目标特征对象对应的目标特
征, 得到目标特征集合, 其中, 所述特征词典中包括多个特征对象与多个特征间的映射关
系;
构建模块, 用于对于每个所述目标特征对象, 基于所述待分析评论文本、 所述目标特征
对象和所述目标 特征对象对应的目标 特征, 构建所述目标 特征对象对应的目标 特征文本;
分析模块, 用于分别对每个所述目标特征文本进行细粒度情感分析, 得到多个情感倾
向分析子结果;
第二确定模块, 用于基于所述多个情感倾向分析子结果确定所述待分析评论文本的目
标情感倾向分析结果, 其中, 所述 目标情感倾向分析结果用于反映所述 目标特征集合中每
种所述目标 特征的目标情感倾向极性。
9.一种非易失性存储介质, 其特征在于, 所述非易失性存储介质包括存储的程序, 其
中, 所述非易 失性存储介质所在设备通过运行所述程序执行权利要求 1至7中任意一项所述
的评论文本情感倾向分析 方法。
10.一种电子设备, 其特征在于, 包括: 存储器和 处理器, 其中, 所述存储器中存储有计
算机程序, 所述处理器被配置为通过所述计算机程序执行权利要求 1至7中任意一项 所述的
评论文本情感倾向分析 方法。权 利 要 求 书 2/2 页
3
CN 115438668 A
3
专利 评论文本情感倾向分析方法及装置
文档预览
中文文档
20 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-03-03 12:13:40上传分享