iso file download
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211120090.9 (22)申请日 2022.09.15 (71)申请人 吉林大学 地址 130012 吉林省长 春市前进大街269 9 号 (72)发明人 彭涛 王承伟 包铁 张雪松  (74)专利代理 机构 北京专赢专利代理有限公司 11797 专利代理师 李斌 (51)Int.Cl. G06F 16/36(2019.01) G06F 16/35(2019.01) G06F 40/295(2020.01) G06F 40/30(2020.01) G06N 3/04(2006.01)G06N 3/08(2006.01) G06N 20/20(2019.01) (54)发明名称 一种利用语义分割来解决方面观点对抽取 的方法 (57)摘要 本发明公开了—种利用语义分割来解决方 面观点对抽取的方法, 该利用语义分割来解决方 面观点对抽取的方法, 包括编码模块、 双通道语 义分割模块和标记和分类模块, 在编码模块计算 实体表示和关系表示的交互矩阵, 利用双通道语 义分割模块同时为两个子任务捕捉任务不变的 和任务特定的特征, 利用标记和分类模块进行实 体识别和关系检测, 通过联合学习的方式, 利用 双通道的语义分割模块同时进行实体识别和关 系检测子任务, 使得模型在不利用外部信息的情 况下, 为两个子任务捕获局部上下文信息和长程 依赖信息, 并且可 以很好的解决误差传播问题, 有效的提升 了模型的性能。 权利要求书2页 说明书5页 附图1页 CN 115455201 A 2022.12.09 CN 115455201 A 1.一种利用语义分割来 解决方面观点对抽取的方法, 其特 征在于, 包括以下步骤: 1)编码模块: 将评论句输入预训练语言模型中, 获取一个初始的实体特征表示, 然后通 过关联计算得到关系特 征表示, 将两种特 征表示进行交 互并得到一个交 互矩阵; 2)双通道语义分割模块: 将交互矩阵输入到语义分割模块中, 利用下采样, 可以获取到 任务不变的特征, 利用上采样, 可以分别为两个子任务 获取到任务特定的特征, 然后 将实体 特征表示和关系特征表示通过skip ‑connection机制与下采样过程中的信息进行交互, 为 两个子任务分别提供补充信息; 3)标记和分类模块: 将实体识别子任务视为序列标注任务, 将语义分割模块得到的实 体分割矩阵转换为序列的形式, 并且利用CRF进 行序列标注, 将关系检测子任务视为二元分 类任务, 将语义分割模块得到的关系分割矩阵通过Softmax获得方面词和关系词的匹配结 果, 构建一个联合学习的损失函数, 同时对两个子任务进行训练。 2.根据权利要求1所述的利用语义分割来解决方面观点对抽取的方法, 其特征在于, 在 步骤1)中, 给定具有N个token的评 论句: S={w1, ..., wN}, 评论句S通 过预训练模型获得初始 的实体特 征表示: He=BERT({w1,…, wN})    (1) 其中句子编码He={h1,…, hN}, d是隐层状态维度。 3.根据权利要求2所述的利用语义分割来解决方面观点对抽取的方法, 其特征在于, 通 过实体特 征表示计算to ken级的关系特 征表示, 将实体和关系特 征表示相加进行交 互: F(hm, hn)=[hm⊙hn; cos(hm, hn); hmWhn]+He       (2) 其中F(hm, hn)是交互矩阵, hm, hn∈He, W是可学习的权 重。 4.根据权利要求1所述的利用语义分割来解决方面观点对抽取的方法, 其特征在于, 在 步骤2)中, 所述双通道语义分割模块包括一个下采样过程和两个上采样过程, 能够对两个 子任务进行特征提取, 所述下采样过程由两个下采样块组成, 每个所述下采样块均包含两 个卷积层和一个 max‑pooling层, 每个所述上采样过程均由两个上采样块组成, 每个所述上 采样块均包 含两个卷积层和一个反卷积层。 5.根据权利要求1所述的利用语义分割来解决方面观点对抽取的方法, 其特征在于, 利 用CRF进行序列标注并计算序列E的概 率分布, 通过计算相邻标记的关系寻找全局最优解: 其中 和 是相邻标记 的可训练权 重, Y是所有可能的标记集 合。 6.根据权利要求5所述的利用语义分割来解决方面观点对抽取的方法, 其特征在于, 负 对数似然函数作为实体识别的损失函数: 权 利 要 求 书 1/2 页 2 CN 115455201 A 2其中yE*是实体特 征序列E的标注序列。 7.根据权利要求6所述的利用语义分割来解决方面观点对抽取的方法, 其特征在于, 利 用关系分割矩阵, 通过计算每个token对的条件概率分布 得到预测的关 系分布 得到作为关系检测的损失函数: 其中 为标注的关系分割矩阵的分布, P是所有可能的关系集 合, BCELoss为二分类交叉熵损失函数。 8.根据权利要求7所述的利用语义分割来解决方面观点对抽取的方法, 其特征在于, 实 体识别的损失函数Lentity和关系检测的损失函数Lrelation能够得出最终损失函数: L= λLentity+(1‑λ )Lrelation      (7) 其中λ是联合学习的平衡权 重。权 利 要 求 书 2/2 页 3 CN 115455201 A 3

PDF文档 专利 一种利用语义分割来解决方面观点对抽取的方法

文档预览
中文文档 9 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共9页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种利用语义分割来解决方面观点对抽取的方法 第 1 页 专利 一种利用语义分割来解决方面观点对抽取的方法 第 2 页 专利 一种利用语义分割来解决方面观点对抽取的方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:13:50上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。