专利 评论信息情感偏好识别模型训练方法、识别方法及设备

(19)国家知识产权局 (12)发明专利 (10)授权公告号 (45)授权公告日 (21)申请号 202211078798.2 (22)申请日 2022.09.05 (65)同一申请的已公布的文献号申请公布号 CN 115146607 A (43)申请公布日 2022.10.04 (73)专利权人北京智源人工智能研究院地址 100084 北京市海淀区中关村东路1号院8号楼三层B201D-1 (72)发明人王业全　张恒然　孙爱欣　 (74)专利代理机构北京动力号知识产权代理有限公司 1 1775 专利代理师董钢 (51)Int.Cl. G06F 40/186(2020.01) G06F 40/194(2020.01)G06K 9/62(2022.01) G06F 16/35(2019.01) (56)对比文件 CN 114979346 A,202 2.08.30 CN 108415972 A,2018.08.17 CN 111144374 A,2020.0 5.12 WO 20182176 65 A1,2018.1 1.29 Yiyi Liu 等.A Dual- Channel Framew ork for Sarcas m Recogn ition by Detecti ng. 《arxiv》 .2021,1-1 1. 审查员王晓时 (54)发明名称评论信息情感偏好识别模型训练方法、识别方法及设备 (57)摘要本发明公开了评论信息情感偏好识别模型训练方法、识别方法及设备，属于自然语言处理技术领域。评论信息情感偏好识别模型训练方法包括在原始通道中生成各组评论训练数据各自对应的原始文本模板，并在镜像通道中生成交换原始文本模板中比较对象的位置后形成的镜像文本模板，其中每组评论训练数据均包括评论信息、两个比较对象和属性；基于各个评论信息、原始文本模板和镜像文本模板，对原始通道和镜像通道中的情感偏好识别模型进行训练及优化，以使情感偏好识别模型用于输出评论信息中两个比较对象针对该属性的情感偏好结果。本发明通过双通道模型训练，降低了比较对象在评论信息句子中的顺序敏感度，在对比情感分析的实际应用中提高了识别准确度。权利要求书2页说明书11页附图3页 CN 115146607 B 2022.11.04 CN 115146607 B 1.一种评论信息情感偏好识别模型训练方法，其特征在于，包括：在原始通道中生成各组评论训练数据各自对应的原始文本模板，并在镜像通道中生成交换所述原始文本模板中比较对象的位置后形成的镜像文本模板，其中，每组所述评论训练数据均包括：评论信息、以及自该评论信息中提取的两个比较对象和属性；基于各个所述评论信息、原始文本模板和镜像文本模板，对所述原始通道和所述镜像通道中的情感偏好识别模型进行训练及优化，以使所述情感偏好识别模型用于输出评论信息中两个比较对象针对所述属性的情感偏好结果。 2.根据权利要求1所述的评论信息情感偏好识别模型训练方法，其特征在于，所述情感偏好识别模型包括：预训练模型和分类器；所述预训练模型用于对输入的评论信息以及该评论信息对应的原始文本模板或镜像文本模板进行编码，以输出该评论信息的结果数据，其中，所述结果数据包括：句子表达向量和观点表达向量；所述分类器用于根据同一通道中的所述预训练模型输出的结果数据生成所述评论信息对应的情感偏好预测结果，其中，该情感偏好预测结果包括：情感偏好中相同、更好和更差各自的占比。 3.根据权利要求2所述的评论信息情感偏好识别模型训练方法，其特征在于，所述基于各个所述评论信息、原始文本模板和镜像文本模板，对所述原始通道和所述镜像通道中的情感偏好识别模型进行训练及优化，进一步包括：基于各个所述评论信息和原始文本模板对所述原始通道中的第一预训练模型进行训练，并采用该原始通道中的第一分类器基于该第一预训练模型输出的结果数据生成所述评论信息对应的第一情感偏好预测结果；以及，基于各个所述评论信息和镜像文本模板对所述镜像通道中的第二预训练模型进行训练，并采用该镜像通道中的第二分类器基于该第二预训练模型输出的结果数据生成所述评论信息对应的第二情感偏好预测结果；根据所述第一情感偏好预测结果和所述第二情感偏好预测结果生成当前的观点目标，以及，根据所述第一预训练模型和所述第二预训练模型分别输出的结果数据中的观点表达向量生成当前的比较目标；应用所述当前的比较目标和所述观点目标对所述第一预训练模型、第二预训练模型、第一分类器和第二分类器进行目标优化，并对优化后的第一预训练模型、第二预训练模型、第一分类器和第二分类器进行迭代训练。 4.根据权利要求3所述的评论信息情感偏好识别模型训练方法，其特征在于，所述根据所述第一情感偏好预测结果和所述第二情感偏好预测结果生成当前的观点目标，进一步包括：以所述原始通道和所述镜像通道的交叉熵函数作为观点目标损失函数，对所述第一情感偏好预测结果和所述第二情感偏好预测结果进行交叉熵函数最小化计算，以得到当前的观点目标。 5.根据权利要求3所述的评论信息情感偏好识别模型训练方法，其特征在于，所述根据所述第一预训练模型和所述第二预训练模型分别输出的结果数据中的观点表达向量生成当前的比较目标，进一步包括：权　利　要　求　书 1/2 页 2 CN 115146607 B 2获取所述第一预训练模型和所述第二预训练模型输出的结果数据中的观点表达向量之间的余弦相似度；若所述第一预训练模型和所述第二预训练模型输出的结果数据中的观点表达向量分别为：更好和更差，则以所述余弦相似度的铰链损失函数作为比较目标损失函数，对所述第一预训练模型和第二预训练模型各自输出的观点表达向量进行距离最大化计算，以得到当前的比较目标。 6.根据权利要求5所述的评论信息情感偏好识别模型训练方法，其特征在于，所述根据所述第一预训练模型和所述第二预训练模型分别输出的结果数据中的观点表达向量生成当前的比较目标，进一步包括：若所述第一预训练模型和所述第二预训练模型输出的结果数据中的观点表达向量均为：相同，则以所述余弦相似度的铰链损失函数作为比较目标损失函数，对所述第一预训练模型和第二预训练模型各自输出的观点表达向量进行距离最小化计算，以得到当前的比较目标。 7.根据权利要求3至6任一项所述的评论信息情感偏好识别模型训练方法，其特征在于，所述应用所述当前的比较目标和所述观点目标对所述第一预训练模型、第二预训练模型、第一分类器和第二分类器进行目标优化，进一步包括：基于所述当前的比较目标和所述观点目标计算模型训练的目标函数；根据所述目标函数对所述第一预训练模型、第二预训练模型、第一分类器和第二分类器进行目标优化，其中，所述第一预训练模型和第二预训练模型共享参数，所述第一分类器和第二分类器也共享参数。 8.一种评论信息情感偏好识别方法，其特征在于，包括：获取待识别的目标评论信息，所述目标评论信息包括两个比较对象及目标属性；根据所述两个比较对象和目标属性生成所述目标评论信息的目标文本模板，其中该目标文本模板包括：原始文本模板和/或镜像文本模板；将所述目标文本模板输入预设的情感偏好识别模型，以使该情感偏好识别模型输出所述目标评论信息中两个比较对象针对所述目标属性的情感偏好结果；其中，所述情感偏好识别模型预先基于权利要求1至7任一项所述的评论信息情感偏好识别模型训练方法训练得到，且该情感偏好识别模型基于所述目标文本模板选取原始通道中的情感偏好识别模型和/或镜像通道中的情感偏好识别模型。 9.一种电子设备，其特征在于，包括处理器和存储器，所述存储器存储有多条指令，所述处理器用于读取所述指令并执行如权利要求1至7任一项所述的评论信息情感偏好识别模型训练方法，或者执行如权利要求8所述的评论信息情感偏好识别方法。 10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有多条指令，所述多条指令可被处理器读取并执行如权利要求 1至7任一项所述的评论信息情感偏好识别模型训练方法，或者执行如权利要求8所述的评论信息情感偏好识别方法。权　利　要　求　书 2/2 页 3 CN 115146607 B 3

专利 评论信息情感偏好识别模型训练方法、识别方法及设备

专利评论信息情感偏好识别模型训练方法、识别方法及设备