iso file download
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211163013.1 (22)申请日 2022.09.23 (71)申请人 武汉问道信息技 术有限公司 地址 430000 湖北省武汉市东西湖区张柏 路东、 长兴电器南 (72)发明人 高飞 陈莉 张艺家 胡丰 卢万 吴海周 杨逸岱 彭心玥 (74)专利代理 机构 浙江千克知识产权代理有限 公司 33246 专利代理师 任婷婷 (51)Int.Cl. G06F 40/30(2020.01) G06F 16/35(2019.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种基于增强网络转换模型的少样本关系 抽取方法及装置 (57)摘要 本申请公开了一种基于增强网络转换模型 的少样本关系抽取方法及装置, 其方法包括: 对 数据集中每个句子进行转化处理, 得到与数据集 对应的句子向量; 对与数据集对应的句子向量进 行编码处理, 并基于处理后的与数据集对应的句 子向量得到与样本关系对应的原型数据; 确定与 样本关系对应的原型数据以及查询集之间的相 似度, 并根据相似度的结果以及自然语 言处理模 型得到查询集的注意力特征。 相较于传统神经神 经网络可得到突出关系的更多判别特征, 并解决 卷积神经网络无法捕获具有长距离关系等更复 杂的特征的局限性, 不仅减少人工标注语料的成 本, 解决大数据量关系抽取时训练语料匮乏的问 题, 还可有效保障预测结果的精度。 权利要求书2页 说明书12页 附图2页 CN 115392258 A 2022.11.25 CN 115392258 A 1.一种基于增强网络转换模型的少样本关系抽取 方法, 其特 征在于, 包括: 对数据集中每 个句子进行转 化处理, 得到与所述数据集对应的句子向量; 对所述与所述数据集对应的句子向量进行编码处理, 并基于处理后的所述与 所述数据 集对应的句子向量得到与样本关系对应的原型 数据; 确定所述与样本关系 对应的原型数据以及查询集之间的相似度, 并根据 所述相似度的 结果以及自然语言处理模型得到所述查询集的注意力特征; 其中, 所述查询集基于所述与 所述数据集对应的句子向量确定 。 2.根据权利要求1所述的方法, 其特征在于, 所述对数据集中每个句子进行转化处理, 得到与所述数据集对应的句子向量, 包括: 将数据集中每 个句子输入至训练后的词嵌入 模型中, 得到每 个所述句子的词向量; 记录每个所述句子 中每个单词的位置向量, 并对每个所述句子的词向量以及所述每个 所述句子中每 个单词的位置向量进行拼接处 理, 得到与所述数据集对应的句子向量。 3.根据权利要求2所述的方法, 其特征在于, 所述记录每个所述句子 中每个单词的位置 向量之前, 还 包括: 获取每个所述句子对应的句子 长度; 当检测到所述每个所述句子对应的句子长度小于预设句子长度时, 对每个所述句子进 行空表填充处理, 以使处理后的所述每个所述句子对应的句子长度等于所述预设句子长 度; 当检测到所述每个所述句子对应的句子长度 大于所述预设句子长度时, 按照预设划分 方式对每个所述句子进行剪断处理, 以使处理后的所述每个所述句子对应的句子长度等于 所述预设句子 长度。 4.根据权利要求1所述的方法, 其特征在于, 所述对所述与所述数据集对应的句子向量 进行编码处理, 并基于处理后的所述与所述数据集对应的句子向量得到与样本 关系对应的 原型数据, 包括: 对所述与所述数据集对应的句子向量进行分类处理, 并从每类所述句子向量中抽取任 意至少两个句子向量作为支持集; 将所述支持集输入至训练后的语言表征模型, 得到经 过编码处 理后的所述支持集; 基于示例级选择器在处 理后的所述支持集中确定出与样本关系对应的原型 数据。 5.根据权利要求4所述的方法, 其特征在于, 所述对所述与所述数据集对应的句子向量 进行分类处理, 并从每类所述句 子向量中抽取任意至少 两个句子向量作为支持集之后, 还 包括: 将每类所述句子向量中剩余的所有句子向量作为 查询集。 6.根据权利要求5所述的方法, 其特征在于, 所述确定所述与样本关系 对应的原型数据 以及查询集之间的相似度, 包括: 计算所述与样本关系对应的原型数据以及所述查询集中每个句子向量之间的欧几里 得距离; 根据预设转换关系将计算出的所述欧几里 得距离转换为相似度。 7.根据权利要求6所述的方法, 其特征在于, 所述根据所述相似度的结果以及自然语言 处理模型得到所述 查询集的注意力特 征, 包括:权 利 要 求 书 1/2 页 2 CN 115392258 A 2在所述查询集中筛 选出所述相似度高于预设阈值的所有句子向量; 将筛选出的所述所有句子向量以及所述支持集中所有句子向量输入至自然语言处理 模型, 得到所述 查询集中每 个句子的注意力特 征。 8.一种基于增强网络转换模型的少样本关系抽取装置, 其特 征在于, 包括: 数据转换模块, 用于对数据集中每个句子进行转化处理, 得到与所述数据集对应的句 子向量; 数据处理模块, 用于对所述与所述数据集对应的句子向量进行编码处理, 并基于处理 后的所述与所述数据集对应的句子向量得到与样本关系对应的原型 数据; 数据分析模块, 用于确定所述与样本关系对应的原型数据以及查询集之间的相似度, 并根据所述相似度的结果以及自然语言处理模型得到所述查询集的注意力特征; 其中, 所 述查询集基于所述与所述数据集对应的句子向量确定 。 9.一种基于增强网络转换模型的少样本关系抽取装置, 其特征在于, 包括处理器以及 存储器; 所述处理器与所述存 储器连接; 所述存储器, 用于存 储可执行程序代码; 所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序 代码对应的程序, 以用于执 行如权利要求1 ‑7任一项所述方法的步骤。 10.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机可读 存储介质中存储有指令, 当所述指令在计算机或处理器上运行时, 使得所述计算机或处理 器执行如权利要求1 ‑7任一项所述方法的步骤。权 利 要 求 书 2/2 页 3 CN 115392258 A 3
专利 一种基于增强网络转换模型的少样本关系抽取方法及装置
文档预览
中文文档
17 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助3元下载(无需注册)
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助3元下载
本文档由 SC 于
2024-03-03 12:13:44
上传分享
举报
下载
原文档
(671.4 KB)
分享
友情链接
GB-T 13910-2008 石英砂 粉 厂、滑石粉厂防尘技术规程.pdf
防病毒安全管理制度.pdf
GB-T 36687-2018 保险术语.pdf
绿盟 2015绿盟科技云安全解决方案.pdf
HJ 164-2020 地下水环境监测技术规范.pdf
SN-T 3953-2014 国境口岸轮状病毒(A组)、诺如病毒、星状病毒的多重RT-PCR检测方法.pdf
ISO 17987-2-2016.pdf
GB-T 13560-2017 烧结钕铁硼永磁材料.pdf
医疗卫生机构网络安全管理办法.pdf
NY-T 536-2017 鸡伤寒和鸡白痢诊断技术.pdf
等保二级-安全技术-网络安全.doc
GB-T 43380-2023 自动化干散货码头综合管控系统技术要求.pdf
GB-T 43493.3-2023 半导体器件 功率器件用碳化硅同质外延片缺陷的无损检测识别判据 第3部分:缺陷的光致发光检测方法.pdf
GB-T 31344-2014 节能量测量和验证技术要求 板坯加热炉系统.pdf
T-CCGA 40009—2021 车载液氢系统安全技术规范.pdf
T-CEC 712—2022 抽水蓄能电站故障录波配置导则.pdf
SY-T 7627-2021 水基压裂液技术要求.pdf
CSA 云渗透测试指南.pdf
T-CIE 070—2020 工业级高可靠集成电路评价 第4部分: 非易失性存储器.pdf
DL-T 5783-2019 水电水利地下工程地质超前预报技术规程.pdf
1
/
17
评价文档
赞助3元 点击下载(671.4 KB)
回到顶部
×
微信扫码支付
3
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。