iso file download
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210887099.6 (22)申请日 2022.07.26 (71)申请人 北京明略昭辉科技有限公司 地址 100098 北京市海淀区北三环西路25 号27号楼二层2020室 (72)发明人 苑世娇 荆小兵  (74)专利代理 机构 北京华夏泰和知识产权代理 有限公司 1 1662 专利代理师 曾军 (51)Int.Cl. G06F 16/332(2019.01) G06F 16/33(2019.01) G06F 16/36(2019.01) G06F 40/30(2020.01) G06F 40/295(2020.01) (54)发明名称 图谱检索方法和装置、 电子设备和存 储介质 (57)摘要 本申请提供了一种图谱检索方法和装置、 电 子设备和存储介质。 其中, 方法包括: 获取需要进 行答案搜索的问题信息; 确定出问题信息对应的 候选实体, 以及候选实体的实体类别; 按照实体 类别, 在模式图中查询到包含有至少一个目标节 点的候选路径, 其中, 目标节点为用于指示实体 类别的节点; 根据所有候选路径, 以及实体类别 对应的候选实体, 生成目标查询图, 其中, 目标查 询图中包括所有目标节点; 按照目标查询图解析 得到查询语言, 并基于查询语言查询到问题信息 对应的答案。 本实施例中的方法, 克服了相关技 术中需要人工定义用于图谱检索 的模板进而导 致成本很高, 且泛化性能差的技 术问题。 权利要求书3页 说明书14页 附图4页 CN 115408503 A 2022.11.29 CN 115408503 A 1.一种图谱检索方法, 其特 征在于, 包括: 获取需要 进行答案 搜索的问题信息; 确定出所述问题信息对应的候选实体, 以及所述 候选实体的实体 类别; 按照所述实体类别, 在模式图中查询到包含有至少一个目标节点的候选路径, 其中, 所 述目标节点 为用于指示所述实体 类别的节点; 根据所有所述候选路径, 以及所述实体类别 对应的所述候选实体, 生成目标查询图, 其 中, 所述目标查询图中包括所有所述目标节点; 按照所述目标查询图解析得到查询语言, 并基于所述查询语言查询到所述问题信 息对 应的答案 。 2.根据权利要求1所述的方法, 其特征在于, 所述按照所述实体类别, 在模式图中查询 到包含有至少一个目标节点的候选路径, 包括: 按照所述实体类别, 以及预设的最大跳变次数, 在所述模式图中执行至少一轮遍历操 作, 查询到包含有 所述目标节 点的至少一个所述候选路径, 其中, 最大跳变次数用于指示从 所述目标节点跳转至最远节点所需经过的节点的个数, 所述最远节点是所述候选路径中与 所述目标节点之间间隔最多数量其他节点的节点, 每轮所述遍历操作中执行的跳变次数小 于或等于所述 最大跳变次数, 不同的所述 候选路径之间至少存在一个不同的节点。 3.根据权利要求2所述的方法, 其特征在于, 所述按照所述实体类别, 以及预设的最大 跳变次数, 在所述模式图中执行至少一轮遍历操作, 查询 到包含有所述 目标节点的至少一 个所述候选路径, 包括: 以所述实体类别对应的目标节点作为所述遍历操作的起始节点, 在所述模式 图中执行 N次跳变操作, 其中, N 为所述最大跳变次数的数值; 循环执行以下操作, 直至已执行N次跳变操作: 在所述N次跳变操作中已执行的跳变操 作的总数M次小于N次, 且第M+1次跳变操作跳变至的跳变后节 点与第M次跳变操作时位于的 当前节点之间满足预设关系的情况下, 将所述跳变后节点以及所述当前节点作为复实体, 并确定已执行M次跳变操作, 其中, M为整数, 且0≤M<N, 所述预设关系包括: 所述跳变后节 点 与所述当前节 点中存在一个CVT节点, 且 所述CVT节 点用于描述所述跳变后节 点与所述当前 节点中除所述CVT节 点之外的另一节点的场景; 在所述N次跳变操作中已执行的跳变操作的 总数M次小于N次, 且第M+1次跳变操作跳变至的跳变后节 点与第M次跳变操作时位于的当前 节点之间不满足所述预设 关系的情况 下, 确定已执 行M+1次跳变操作; 在已执行N次跳变操作的情况下, 按照所述N次跳变操作中每次跳变操作的先后次序, 将所述起始节点以及所述N次跳变操作中的每次跳变操作所跳变至的节点相连, 得到所述 候选路径。 4.根据权利要求1所述的方法, 其特征在于, 所述确定出所述问题信息对应的候选实 体, 以及所述 候选实体的实体 类别, 包括: 对所述问题信息进行实体识别, 确定出包含于所述问题信息中的第一实体, 以及所述 第一实体的实体 类别; 按照所述实体类别, 在图数据库中确定与所述第一实体满足预设相关性的第二实体, 其中, 所述图数据库中预设有多个实体, 所述第二实体的实体类别为所述第一实体的实体 类别;权 利 要 求 书 1/3 页 2 CN 115408503 A 2根据所述第 一实体以及所述第 二实体确定出所有所述候选实体, 并确定出与每个所述 候选实体对应的实体 类别。 5.根据权利要求1所述的方法, 其特征在于, 所述根据所有所述候选路径, 以及所述实 体类别对应的所述 候选实体, 生成目标查询图, 包括: 根据所有所述候选路径, 确定出任意两个候选节点之间的关联关系, 其中, 所述候选节 点为所述候选路径中的节点; 根据所述实体 类别对应的所述 候选实体, 确定与每 个候选节点对应的属性信息; 根据所述关联关系、 所述候选节点以及与每个候选节点对应的属性信息, 得到多个候 选查询图, 其中, 对于每个所述候选查询图, 所述候选查询图中包括多个候选节点, 所述多 个候选节点按照所述关联关系进行 连接, 且每 个所述候选节点具有对应的所述属性信息; 按照预设匹配度算法, 在所述多个候选查询图中确定出与所述问题信 息匹配度最高的 所述目标查询图。 6.根据权利要求1至5中任一项所述的方法, 其特征在于, 所述按照所述目标查询图解 析得到查询语言, 并基于所述 查询语言查询到所述问题信息对应的答案, 包括: 根据所述目标查询图中的各个第 一目标节点以及各个第 一目标节点之间的关联关系, 确定出语义表达结构; 按照所述语义表达结构生成查询语言; 通过所述查询语言在图数据库中进行查询, 得到所述 答案。 7.根据权利要求6所述的方法, 其特征在于, 所述根据所述目标查询图中的各个第 一目 标节点以及各个第一目标节点之间的关联关系, 确定出语义表达结构包括: 在所述目标查询图中确定出主链以及支 链; 确定出所述主链上的所有第 二目标节点, 所述所有第 二目标节点中每个第 二目标节点 的属性信息, 以及任意两个相互连接的所述第二目标节点之间的主链关联关系, 其中, 所有 所述第一 目标节点包括第二 目标节点; 确定出所述支链上 的所有第三 目标节点, 所述所有 第三目标节点中每个第三目标节点的属性信息, 以及任意两个相互连接的所述第三目标节 点之间的支链关联关系, 其中, 所述支链上 的所述所有第三 目标节点中存在一个位于所述 主链上的第二目标节点, 所有所述第一目标节点包括第三目标节点; 按照所述第二目标节点的属性信息、 所述主链关联关系、 所述第三目标节点的属性信 息以及所述支 链关联关系生成所述语义表达结构。 8.一种图谱检索装置, 其特 征在于, 包括: 获取模块, 用于获取需要 进行答案 搜索的问题信息; 确定模块, 用于确定出 所述问题信息对应的候选实体, 以及所述 候选实体的实体 类别; 查询模块, 用于按照所述实体类别, 在模式图中查询到包含有至少一个目标节点的候 选路径, 其中, 所述目标节点 为用于指示所述实体 类别的节点; 生成模块, 用于根据 所有所述候选路径, 以及所述实体类别对应的所述候选实体, 生成 目标查询图, 其中, 所述目标查询图中包括所有所述目标节点; 答案确定模块, 用于按照所述目标查询图解析得到查询语言, 并基于所述查询语言查 询到所述问题信息对应的答案 。 9.一种电子设备, 包括处理器、 通信接口、 存储器和通信总线, 其中, 所述处理器、 所述权 利 要 求 书 2/3 页 3 CN 115408503 A 3

PDF文档 专利 图谱检索方法和装置、电子设备和存储介质

文档预览
中文文档 22 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共22页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 图谱检索方法和装置、电子设备和存储介质 第 1 页 专利 图谱检索方法和装置、电子设备和存储介质 第 2 页 专利 图谱检索方法和装置、电子设备和存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:14:28上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。