(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211175184.6
(22)申请日 2022.09.26
(71)申请人 东南大学
地址 210096 江苏省南京市玄武区四牌楼 2
号
(72)发明人 汪可予 李思特 李嘉烨 漆桂林
季秋
(74)专利代理 机构 南京众联专利代理有限公司
32206
专利代理师 杜静静
(51)Int.Cl.
G06N 5/04(2006.01)
G06F 40/30(2020.01)
G06K 9/62(2022.01)
(54)发明名称
一种基于嵌入的不 一致容忍本体推理方法
(57)摘要
本发明公开了一种基于嵌入不一致容忍本
体推理方法, 该方法用于不一致本体推理相关任
务并增强在不一致本体上的查询能力。 首先, 将
本体中的公理转化成自然语言形式的句子。 随后
利用嵌入技术, 将自然语言形式的公理句子映射
成高维空间的语义向量, 利用语义向量计算公理
之间的语义联系。 最后, 通过语义向量之间的语
义联系定义不一致容忍的推理关系。 使用该推理
关系, 可以在不一致本体上推理出一致的结果。
该推理关系拓展经典逻辑到了描述逻辑领域, 具
备良好的逻辑性质, 同时充分考虑到本体中公理
的语义, 具 备更强的不 一致容忍推理能力。
权利要求书3页 说明书6页 附图1页
CN 115481741 A
2022.12.16
CN 115481741 A
1.一种基于嵌入的不 一致容忍本体 推理方法, 其特 征在于, 包 含如下步骤:
步骤(1)生成不 一致本体的所有最大一 致子集;
步骤(2)将OW L语言形式的公理转 化成自然语言形式的句子;
步骤(3)将公理对应的自然语言形式的句子映射成高维空间的语义向量;
步骤(4)为 最大一致子集打 分;
步骤(5)选出 赋分最高的最大一 致子集作为 不一致容忍推理的结果。
2.根据权利要求1所述的一种基于嵌入的不一致容忍推理推理方法, 其特征在于, 所述
步骤(1)生成不一致本体的所有最大一致子集, 假设有本体K, 所生成的最大一致子集K'有
如下定义:
·K'是一致的;
·若
那么K”是不一致的;
用mcs(K)表示由本体K 所有最大一 致子集组成的集 合。
3.根据权利要求1所述的一种基于嵌入不一致容忍本体推理方法, 其特征在于, 所述步
骤(2)具体包 含如下子步骤:
2.1)使用NaturalOW L方法将OW L语言形式的公理 处理为三元组;
2.2)针对数据集 通过自编制代码 将三元组转换为自然语言句子 。
4.根据权利要求1所述的一种基于嵌入的不一致容忍本体推理方法, 其特征在于, 所述
步骤(2)将OW L语言形式的公理转 化成自然语言形式的句子, 具体如下:
1)通过将本体文件导入Protege软件, 使用NaturalOWL插件将OWL语言形式的公理处理
为三元组, 针对数据集 通过自编制代码 将三元组转换为自然语言句子 。
5.根据权利要求1所述的一种基于嵌入的不一致容忍本体推理方法, 其特征在于, 所述
步骤(3)将自然语言形式的公理转 化成高维空间的语义向量, 具体如下:
1)在步骤(2)中将OWL语言形式的公理转化成 自然语言形式的句子, 为了表示公理的语
义信息并计算公理之间的语义关联, 通过Sentence ‑BERT技术将公理所转成的句子映射成
高维空间的语义向量,公理所映射成的语义向量具备如下特征, 语义相似的公理所映射成
的语义向量在高维空间中距离更近 。
6.根据权利要求1所述的一种基于嵌入的不一致容忍本体推理方法, 其特征在于, 所述
步骤(4)具体包 含如下子步骤:
4.1)计算语义向量之间的相似度, 具体相似度计算方法利用余弦距离、 欧几里得距离,
两个公理之间语义相似程度越高, 则它们对应的语义向量相似度越大,基于余弦距离的相
似度函数和基于欧几里 得距离的相似度函数定义如下:
其中, v1,v2分别为在步骤(3)中由两个不同公理转成的语义向量, Cosine_Distance
(v1,v2)表示v1,v2的余弦距离, Eucl idean_Distance(v1,v2)表示v1,v2的欧几里 得距离;
4.2)代入(4.1)中计算得到的相似度, 定义公理在最大一致子集 中的聚合度函数, 一条权 利 要 求 书 1/3 页
2
CN 115481741 A
2公理在一个最大一致子集中的聚合度 汇总了该公理和最大一致子集中公理的相似度, 该公
理在最大一致子集中的公理语义相似关联程度越高, 则它在该最大一致子集中的聚合程度
越高;
给出不同的聚合度函数定义方法如下:
其中, Ki为本体K的一个最大一致子集, α, β 分别为本体 K中公理, Si m( α, β )为公理α和β 的
相似度, 即通过步骤(2)(3)将公理α和β 转成语义向量再通过余弦距离或欧几里得距离计算
相似度, k为一个用于调节的参数, Mk(Ki, α,k)为由Ki中与α相似度值最小的k个公理形成的
集合, H(Ki, α ), T(Ki, α )分别为Ki中与公理α 头实体或尾实体相同的公理 组成的集 合;
4.3)利用(4.2)中定义的聚合度 函数, 为每条公理打分, 一条公理如果出现在更多的最
大一致子集中, 并且在它出现在的最大一致子集中聚合度更高, 则认为这条公理更可信, 它
的赋分更高, 利用上面定义的公理在最大一致子集中聚合度计算方法, 定义如下四种公理
打分函数:
其中, 其中, 本体 K是一个不一致本体, Ki为本体K的最大一致子集, α 为本体 K中公理, mcs
(K)为由本 体K所有最大一 致子集组成的集合, a gg(Ki, α )global、 agg(Ki, α,k)knn、
为(4.2)中定义的聚合度函数, k是 可调的参数;
4.4)汇总每个最大一致子集中公理的赋分, 得到最大一致子集的打分, 包含更多公理、
包含的公理赋分更高的最大一致子集拥有更高的分数, 选出得分最高的最大一致子集, 作
为推理的结果, 并可以用于后续的公理推理和查询, 集 合打分函数定义如下:
权 利 要 求 书 2/3 页
3
CN 115481741 A
3
专利 一种基于嵌入的不一致容忍本体推理方法
文档预览
中文文档
11 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-03-03 12:13:44上传分享