iso file download
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211077911.5 (22)申请日 2022.09.05 (71)申请人 电子科技大 学 地址 611731 四川省成 都市高新区 (西区) 西源大道 2006号 (72)发明人 卢国明 段贵多 陈爱国 罗光春  李雅俊 张昊  (74)专利代理 机构 成都希盛知识产权代理有限 公司 512 26 专利代理师 陈泽斌 (51)Int.Cl. G06F 16/332(2019.01) G06F 16/33(2019.01) G06F 16/36(2019.01) G06F 40/30(2020.01)G06N 5/02(2006.01) G06N 5/04(2006.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种融合语义信息的知识推理问答方法 (57)摘要 本发明涉及自然语 言处理领域, 其公开了一 种融合语义信息的知识推理问答方法, 解决现有 推理方案存在的受限于噪音节 点, 未有效利用关 系类型信息以及上下文语义空间和知识子图符 号空间之间的信息割裂所导致的推理效果差的 问题。 本发 明首先基于知识库检索问题选项对相 关的知识三元组, 构造知识子图; 然后利用预训 练语言模型获得问题选项对的语义信息; 接着, 对知识子图的实体节点特征进行初始化, 并将语 义信息作为额外的节点加入到知识子图中, 获得 混合图, 并根据混合图以及该问题选项对与每个 实体节点之间的相关性, 基于图注 意力机制进行 知识推理; 最后, 将推理得到的输出向量和该问 题选项对的语义信息作为输入, 通过全连接网 络, 预测选项的置信度; 比较每个候选答案选项 的置信度, 取置信度最大的选项作为 正确答案 。 权利要求书4页 说明书10页 附图1页 CN 115470333 A 2022.12.13 CN 115470333 A 1.一种融合语义信息的知识推理问答方法, 其特 征在于, 包括以下步骤: A、 训练知识推理问答模型: A1、 输入问题和候选答案选项集, 所述候选答案选项集中包含该问题对应的多个候选 答案选项, 且其中一个候选答案选项为该问题对应的正确 答案, 并根据输入的问题和候选 答案选项集构建问题选项对; A2、 针对各问题选项对, 分别检索知识库, 获得其对应的问题实体和选项实体, 并抽取 出从问题实体到选项实体的路径, 构建该问题选项对对应的知识三元组; 基于获得 的各问 题选项对的知识三元组, 构造知识子图; A3、 针对各问题选项对, 分别将其问题分词获得的各词语、 答案选项分词获得的各词语 以及步骤A2获得的该问题选项对所涉及实体的知识文本进 行顺序拼接, 并使用分隔符将问 题词语、 答案词语以及实体知识文本三个部 分进行分隔, 获得其输入词 序列; 将获得的各问 题选项对对应的输入词序列, 分别输入到预训练语言模型, 获得各问题选项对的语义信息 zLM以及分词获得 各词语的特 征向量; A4、 针对知识子 图中的每一个实体节点, 根据该实体节点的实体在各问题选项对中对 应的分词获得的词语的特 征向量, 对知识子图的实体节点特 征进行初始化; A5、 针对各问题选项对, 分别按如下步骤获得其 答案选项的置信度: A51、 将该问题选项对的文本作为上下文文本, 然后, 基于该上下文文本以及知识子图 各实体节点的实体的知识文本, 对每 个实体节点与该问题选项对之间的相关性进行打 分; A52、 将步骤A3获得的该问题选项对的语义信息zLM, 作为语义节点加入到知识子图中, 并将语义节点分别连接 到知识子图中的各实体节点, 获得混合图; A53、 根据 步骤A51获得的相关性和步骤A52 获得的混合图, 基于图注意力机制进行知识 推理, 获得知识推理结果; A54、 将步骤A3获取的该问题选项对的语义信息zLM和步骤A53 获取的知识推理结果作为 输入, 通过全连接网络预测该问题选项对的答案 选项的置信度; A6、 根据各问题选项对的答案选项的置信度, 选取置信度最大的答案选项作为问题 的 正确选项; A7、 循环执行步骤A1 ‑A6, 对知识推理问答模型进行迭代训练, 直至模型收敛或达到预 设训练轮次; B、 执行知识推理问答任务: 以问题和相关候选答案作为输入, 基于训练好的知识推理问答模型获得答案 。 2.如权利要求1所述的一种融合语义信息的知识推理问答方法, 其特 征在于, 步骤A2中, 针对各问题选项对, 分别检索知识库, 获得其对应的问题实体和选项实体, 并抽取出从问题实体到 选项实体的路径, 构建该问题选项对 对应的知识三元组, 包括: A21、 对输入的问题选项对(q,a), 进行分词并过滤停用词, 分别将分词获得的各词语与 知识库中的实体进行匹配, 得到该问题选项对(q,a)对应的问题实体集 和选项 实体集 nq, na分别表示问题实体集和选项实体集的实体数量; A22、 根据问题实体集v ′q和选项实体集v ′a, 从知识库中抽取出从各问题实体到各选项 实体的路径, 若一个问题实体和选项实体间存在多条路径, 则取最短路径;权 利 要 求 书 1/4 页 2 CN 115470333 A 2A23、 根据问题实体集v ′q、 选项实体集v ′a和路径信息, 构建输入问题选项对对应的知识 三元组 其中, v′是实体集, 其包括问题实体、 选项实体以及沿路径抽取的实 体, ε′是实体集的实体间的边所构成的边集, 是实体集的实体间的边的关系类型所构成 的关系集。 3.如权利要求1所述的一种融合语义信息的知识推理问答方法, 其特 征在于, 步骤A3中, 将获得的输入词序列, 输入至预训练语言模型ALBERT中, 取ALBERT的最后一 层中首个起始符号 位置对应的隐藏层信息作为该问题选项对的语义信息 zLM。 4.如权利要求1、 2或3任一项所述的一种融合语义信息的知识推理问答方法, 其特征在 于, 步骤A 4中, 针对知识子图中的每一个实体节点, 按如下公 式对知识子图的实体节点特征 进行初始化: 其中, fenc表示预训练语言模型, t riplei表示第i个问题选项 对的输入词序列, 为预 训练预言模型的输出序列, 表示序列 中实体节点vj的实体对应的分词获得的词语 的特征向量, | Tv|为所有问题选项对的知识三元组中包 含实体节点vj的数量。 5.如权利要求1、 2或3任一项所述的一种融合语义信息的知识推理问答方法, 其特征在 于, 步骤A51中, 将该问题选项对的文本作为上下文文本, 然后, 基于该上下文文本以及知识 子图各实体节点实体的知识文本, 对每个实体节点与该问题选项对之间的相关性进行打 分, 包括: 基于给定问题选项对(q,a), 将其问题分词获得的各词语和答案选项分词获得的各词 语顺序拼接构成上下文文本; 然后, 将知识子图中所有的实体节点v 所涉及实体的知识文本 与上下文文本连接起 来, 并输入预训练语言模型, 按如下公式计算相关性得分ρi: ρi=fhead(fenc([text(q,a); text(v)]) ) 其中, fenc表示预训练语言模型, fhead表示注意力机制。 6.如权利要求1所述的一种融合语义信息的知识推理问答方法, 其特征在于, 步骤A53 中, 根据步骤A51获得的相关性和步骤A52获得的混合图, 基于图注 意力机制进 行知识推理, 获得知识推理结果, 包括: 对于一个L层的推理结构, 针对给定的问题选项对的每一层推理中, 通过下式更新该问 题选项所 涉及各实体的实体节点 的表示 其中, fn为激活函数, 表示节点vt的邻居节点, 表示节点vs是包括节点vt和节 点vt的邻居节点在内的节点, 表示推理的层数, 表示从每个节点vs传到节点vt的 信息, 表示D维向量, αst为基于相关性得分获得的从节点vs传到节点vt的信息mst的注意权 利 要 求 书 2/4 页 3 CN 115470333 A 3

PDF文档 专利 一种融合语义信息的知识推理问答方法

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种融合语义信息的知识推理问答方法 第 1 页 专利 一种融合语义信息的知识推理问答方法 第 2 页 专利 一种融合语义信息的知识推理问答方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:13:55上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。