iso file download
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211120090.9 (22)申请日 2022.09.15 (71)申请人 吉林大学 地址 130012 吉林省长 春市前进大街269 9 号 (72)发明人 彭涛 王承伟 包铁 张雪松 (74)专利代理 机构 北京专赢专利代理有限公司 11797 专利代理师 李斌 (51)Int.Cl. G06F 16/36(2019.01) G06F 16/35(2019.01) G06F 40/295(2020.01) G06F 40/30(2020.01) G06N 3/04(2006.01)G06N 3/08(2006.01) G06N 20/20(2019.01) (54)发明名称 一种利用语义分割来解决方面观点对抽取 的方法 (57)摘要 本发明公开了—种利用语义分割来解决方 面观点对抽取的方法, 该利用语义分割来解决方 面观点对抽取的方法, 包括编码模块、 双通道语 义分割模块和标记和分类模块, 在编码模块计算 实体表示和关系表示的交互矩阵, 利用双通道语 义分割模块同时为两个子任务捕捉任务不变的 和任务特定的特征, 利用标记和分类模块进行实 体识别和关系检测, 通过联合学习的方式, 利用 双通道的语义分割模块同时进行实体识别和关 系检测子任务, 使得模型在不利用外部信息的情 况下, 为两个子任务捕获局部上下文信息和长程 依赖信息, 并且可 以很好的解决误差传播问题, 有效的提升 了模型的性能。 权利要求书2页 说明书5页 附图1页 CN 115455201 A 2022.12.09 CN 115455201 A 1.一种利用语义分割来 解决方面观点对抽取的方法, 其特 征在于, 包括以下步骤: 1)编码模块: 将评论句输入预训练语言模型中, 获取一个初始的实体特征表示, 然后通 过关联计算得到关系特 征表示, 将两种特 征表示进行交 互并得到一个交 互矩阵; 2)双通道语义分割模块: 将交互矩阵输入到语义分割模块中, 利用下采样, 可以获取到 任务不变的特征, 利用上采样, 可以分别为两个子任务 获取到任务特定的特征, 然后 将实体 特征表示和关系特征表示通过skip ‑connection机制与下采样过程中的信息进行交互, 为 两个子任务分别提供补充信息; 3)标记和分类模块: 将实体识别子任务视为序列标注任务, 将语义分割模块得到的实 体分割矩阵转换为序列的形式, 并且利用CRF进 行序列标注, 将关系检测子任务视为二元分 类任务, 将语义分割模块得到的关系分割矩阵通过Softmax获得方面词和关系词的匹配结 果, 构建一个联合学习的损失函数, 同时对两个子任务进行训练。 2.根据权利要求1所述的利用语义分割来解决方面观点对抽取的方法, 其特征在于, 在 步骤1)中, 给定具有N个token的评 论句: S={w1, ..., wN}, 评论句S通 过预训练模型获得初始 的实体特 征表示: He=BERT({w1,…, wN}) (1) 其中句子编码He={h1,…, hN}, d是隐层状态维度。 3.根据权利要求2所述的利用语义分割来解决方面观点对抽取的方法, 其特征在于, 通 过实体特 征表示计算to ken级的关系特 征表示, 将实体和关系特 征表示相加进行交 互: F(hm, hn)=[hm⊙hn; cos(hm, hn); hmWhn]+He (2) 其中F(hm, hn)是交互矩阵, hm, hn∈He, W是可学习的权 重。 4.根据权利要求1所述的利用语义分割来解决方面观点对抽取的方法, 其特征在于, 在 步骤2)中, 所述双通道语义分割模块包括一个下采样过程和两个上采样过程, 能够对两个 子任务进行特征提取, 所述下采样过程由两个下采样块组成, 每个所述下采样块均包含两 个卷积层和一个 max‑pooling层, 每个所述上采样过程均由两个上采样块组成, 每个所述上 采样块均包 含两个卷积层和一个反卷积层。 5.根据权利要求1所述的利用语义分割来解决方面观点对抽取的方法, 其特征在于, 利 用CRF进行序列标注并计算序列E的概 率分布, 通过计算相邻标记的关系寻找全局最优解: 其中 和 是相邻标记 的可训练权 重, Y是所有可能的标记集 合。 6.根据权利要求5所述的利用语义分割来解决方面观点对抽取的方法, 其特征在于, 负 对数似然函数作为实体识别的损失函数: 权 利 要 求 书 1/2 页 2 CN 115455201 A 2其中yE*是实体特 征序列E的标注序列。 7.根据权利要求6所述的利用语义分割来解决方面观点对抽取的方法, 其特征在于, 利 用关系分割矩阵, 通过计算每个token对的条件概率分布 得到预测的关 系分布 得到作为关系检测的损失函数: 其中 为标注的关系分割矩阵的分布, P是所有可能的关系集 合, BCELoss为二分类交叉熵损失函数。 8.根据权利要求7所述的利用语义分割来解决方面观点对抽取的方法, 其特征在于, 实 体识别的损失函数Lentity和关系检测的损失函数Lrelation能够得出最终损失函数: L= λLentity+(1‑λ )Lrelation (7) 其中λ是联合学习的平衡权 重。权 利 要 求 书 2/2 页 3 CN 115455201 A 3
专利 一种利用语义分割来解决方面观点对抽取的方法
文档预览
中文文档
9 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助3元下载(无需注册)
温馨提示:本文档共9页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助3元下载
本文档由 SC 于
2024-03-03 12:13:50
上传分享
举报
下载
原文档
(554.3 KB)
分享
友情链接
信通院 人工智能数据安全白皮书.pdf
案例-数据治理流程概述 .pdf
T BJQC 智能网联汽车信息安全测试方法(征求意见稿).pdf
飞驰云联 企业数据防泄密产品选型指南 2021.pdf
T-ZJBE 002—2023 电动自行车充换电消防安全技术要求.pdf
GB-T 23447-2023 卫生洁具 淋浴用花洒.pdf
GB-T 35913-2018 地采暖用实木地板技术要求.pdf
GB-T 20169-2015 离子型稀土矿混合稀土氧化物.pdf
GB-T 30279-2013 信息安全技术 安全漏洞等级划分指南.pdf
T-CI 038—2023 污泥脱水调理剂.pdf
法律法规 贵阳市大数据安全管理条例2021-06-07.pdf
数据供应链管理办法.pdf
GB-T 30285-2013 信息安全技术 灾难恢复中心建设与运维管理规范.pdf
GBT 4109-2022 交流电压高于1000V的绝缘套管.pdf
T-SDL 3.2—2021 10 kV智能电缆系统技术规范 第 2 部分 智能电缆测控系统终端.pdf
GB-T 37090-2018 信息安全技术 病毒防治产品安全技术要求和测试评价方法.pdf
GB-T 24498-2009 建筑门窗、幕墙用密封胶条.pdf
法律法规 银川市建筑节能管理条例2011-12-12.pdf
GB-T 31052.8-2016 起重机械 检查与维护规程 第8部分:铁路起重机.pdf
GB-T 17393-2008 覆盖奥氏体不锈钢用绝热材料规范.pdf
1
/
9
评价文档
赞助3元 点击下载(554.3 KB)
回到顶部
×
微信扫码支付
3
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。