(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202211078798.2
(22)申请日 2022.09.05
(65)同一申请的已公布的文献号
申请公布号 CN 115146607 A
(43)申请公布日 2022.10.04
(73)专利权人 北京智源人工智能研究院
地址 100084 北京市海淀区中关村东路1号
院8号楼三层B201D-1
(72)发明人 王业全 张恒然 孙爱欣
(74)专利代理 机构 北京动力号知识产权代理有
限公司 1 1775
专利代理师 董钢
(51)Int.Cl.
G06F 40/186(2020.01)
G06F 40/194(2020.01)G06K 9/62(2022.01)
G06F 16/35(2019.01)
(56)对比文件
CN 114979346 A,202 2.08.30
CN 108415972 A,2018.08.17
CN 111144374 A,2020.0 5.12
WO 20182176 65 A1,2018.1 1.29
Yiyi Liu 等.A Dual- Channel Framew ork
for Sarcas m Recogn ition by Detecti ng.
《arxiv》 .2021,1-1 1.
审查员 王晓时
(54)发明名称
评论信息情感偏好识别模型训练方法、 识别
方法及设备
(57)摘要
本发明公开了评论信息情感偏好识别模型
训练方法、 识别方法及设备, 属于自然语言处理
技术领域。 评论信息情感偏好识别模 型训练方法
包括在原始通道中生成各组评论训练数据各自
对应的原始文本模板, 并在镜像通道中生成交换
原始文本模板中 比较对象的位置后形成的镜像
文本模板, 其中每组评论训练数据均包括评论信
息、 两个比较对象和属性; 基于各个评论信息、 原
始文本模板和镜像文本模板, 对原始通道和镜像
通道中的情感偏好识别模型进行训练及优化, 以
使情感偏好识别模型用于输出评论信息中两个
比较对象针对 该属性的情感偏好结果。 本发明通
过双通道模 型训练, 降低了比较对象在评论信息
句子中的顺序敏感度, 在对比情感分析的实际应
用中提高了识别准确度。
权利要求书2页 说明书11页 附图3页
CN 115146607 B
2022.11.04
CN 115146607 B
1.一种评论信息情感偏好识别模型训练方法, 其特 征在于, 包括:
在原始通道中生成各组评论训练数据 各自对应的原始文本模板, 并在镜像通道中生成
交换所述原始文本模板中比较对 象的位置后形成的镜像文本模板, 其中, 每组所述评论训
练数据均包括: 评论信息、 以及自该评论信息中提取的两个比较对象和 属性;
基于各个所述评论信息、 原始文本模板和镜像文本模板, 对所述原始通道和所述镜像
通道中的情感偏好识别模型进 行训练及 优化, 以使所述情感偏好识别模型用于输出评论信
息中两个比较对象针对所述属性的情感偏好结果。
2.根据权利要求1所述的评论信 息情感偏好识别模型训练方法, 其特征在于, 所述情感
偏好识别模型包括: 预训练模型和分类 器;
所述预训练模型用于对输入的评论信息以及该评论信息对应的原始文本模板或镜像
文本模板进行编码, 以输出该评论信息的结果数据, 其中, 所述结果数据包括: 句子表达向
量和观点表达向量;
所述分类器用于根据同一通道中的所述预训练模型输出的结果数据生成所述评论信
息对应的情感偏好预测结果, 其中, 该情感偏好预测结果包括: 情感偏好中相同、 更好和更
差各自的占比。
3.根据权利要求2所述的评论信 息情感偏好识别模型训练方法, 其特征在于, 所述基于
各个所述评论信息、 原始文本模板和镜像文本模板, 对所述原始通道和所述镜像通道中的
情感偏好识别模型进行训练及优化, 进一 步包括:
基于各个所述评论信息和原始文本模板对所述原始通道中的第一预训练模型进行训
练, 并采用该原始 通道中的第一分类器基于该第一预训练模型输出的结果数据生成所述评
论信息对应的第一情感偏好预测结果;
以及, 基于各个所述评论信 息和镜像文本模板对所述镜像通道中的第 二预训练模型进
行训练, 并采用该镜像通道中的第二分类器基于该第二预训练模型输出的结果数据生成所
述评论信息对应的第二情感偏好预测结果;
根据所述第 一情感偏好预测结果和所述第 二情感偏好预测结果生成当前的观点目标,
以及, 根据所述第一预训练模型和所述第二预训练模型分别输出的结果数据中的观点表达
向量生成当前的比较目标;
应用所述当前的比较目标和所述观点目标对所述第一预训练模型、 第二预训练模型、
第一分类器和 第二分类器进行目标优化, 并对优化后的第一预训练模 型、 第二预训练模型、
第一分类 器和第二分类 器进行迭代训练。
4.根据权利要求3所述的评论信 息情感偏好识别模型训练方法, 其特征在于, 所述根据
所述第一情感偏好预测结果和所述第二情感偏好预测结果生成当前的观点目标, 进一步包
括:
以所述原始通道和所述镜像通道的交叉熵函数作为观点目标损失函数, 对所述第 一情
感偏好预测结果和所述第二情感偏好预测结果进 行交叉熵函数最小化计算, 以得到 当前的
观点目标。
5.根据权利要求3所述的评论信 息情感偏好识别模型训练方法, 其特征在于, 所述根据
所述第一预训练模型和所述第二预训练模型分别输出的结果数据中的观点表达 向量生成
当前的比较目标, 进一 步包括:权 利 要 求 书 1/2 页
2
CN 115146607 B
2获取所述第一预训练模型和所述第二预训练模型输出的结果数据中的观点表达向量
之间的余弦相似度;
若所述第一预训练模型和所述第二预训练模型输出的结果数据中的观点表达向量分
别为: 更好和更差, 则以所述余弦相似度的铰链损失函数作为比较目标损失函数, 对所述第
一预训练模型和 第二预训练模型各自输出的观点表达向量进 行距离最大化计算, 以得到当
前的比较目标。
6.根据权利要求5所述的评论信 息情感偏好识别模型训练方法, 其特征在于, 所述根据
所述第一预训练模型和所述第二预训练模型分别输出的结果数据中的观点表达 向量生成
当前的比较目标, 进一 步包括:
若所述第一预训练模型和所述第二预训练模型输出的结果数据中的观点表达向量均
为: 相同, 则以所述余弦相似度的铰链损失函数作为比较目标损失函数, 对所述第一预训练
模型和第二预训练模型各自输出的观点表达向量进行距离最小化计算, 以得到 当前的比较
目标。
7.根据权利要求3至6任一项所述的评论信息情感偏好识别模型训练方法, 其特征在
于, 所述应用所述当前 的比较目标和所述观点 目标对所述第一预训练模型、 第二预训练模
型、 第一分类 器和第二分类 器进行目标优化, 进一 步包括:
基于所述当前的比较目标和所述观点目标计算模型训练的目标函数;
根据所述目标函数对所述第一预训练模型、 第二预训练模型、 第一分类器和第二分类
器进行目标优化, 其中, 所述第一预训练模型和 第二预训练模 型共享参数, 所述第一分类器
和第二分类 器也共享 参数。
8.一种评论信息情感偏好识别方法, 其特 征在于, 包括:
获取待识别的目标评论信息, 所述目标评论信息包括两个比较对象及目标属性;
根据所述两个比较对象和目标属性生成所述目标评论信 息的目标文本模板, 其中该目
标文本模板包括: 原 始文本模板和/或镜像文本模板;
将所述目标文本模板输入预设的情感偏好识别模型, 以使该情感偏好识别模型输出所
述目标评论信息中两个比较对象针对所述目标属性的情感偏好结果;
其中, 所述情 感偏好识别模型预先基于权利要求1至7任一项所述的评论信息情 感偏好
识别模型训练方法训练得到, 且该情感偏好识别模型基于所述目标文本模板选取原始通道
中的情感偏好识别模型和/或镜像通道中的情感偏好识别模型。
9.一种电子设备, 其特征在于, 包括处理器和存储器, 所述存储器存储有多条指令, 所
述处理器用于读取所述指令并执行如权利要求1至7任一项所述的评论信息情感偏好识别
模型训练方法, 或者执 行如权利要求8所述的评论信息情感偏好识别方法。
10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质存储有多条指
令, 所述多 条指令可被处理器读取并执行如权利要求 1至7任一项 所述的评论信息情感偏好
识别模型训练方法, 或者执 行如权利要求8所述的评论信息情感偏好识别方法。权 利 要 求 书 2/2 页
3
CN 115146607 B
3
专利 评论信息情感偏好识别模型训练方法、识别方法及设备
文档预览
中文文档
17 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 02:16:08上传分享