(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211175334.3
(22)申请日 2022.09.26
(71)申请人 中山大学
地址 510275 广东省广州市海珠区新港西
路135号
(72)发明人 沈知雨 刘思榆 艾陶 侯一鸣
陈诗瑜 余建兴 印鉴
(74)专利代理 机构 广州粤高专利商标代理有限
公司 44102
专利代理师 高棋
(51)Int.Cl.
G06F 16/332(2019.01)
G06F 16/29(2019.01)
G06F 16/36(2019.01)
G06F 40/30(2020.01)G06F 40/279(2020.01)
G06N 3/04(2006.01)
G06Q 50/20(2012.01)
(54)发明名称
一种基于知识引导的地理考题生成方法和
装置
(57)摘要
本发明提供一种基于知识引导的地理考题
生成方法, 包括以下步骤: S1: 获取非结构化的地
理知识文本语料构建地理文本语料库; S2: 设置
句法模板, 从地理文本语料库识别得到相应的事
理句子; S3: 从事理句子中抽取地理事件; S4: 对
地理事件进行泛化, 并根据泛化后的地理事件构
建结构化的地理知识图谱; S5: 根据结构化的地
理知识图谱构建图知识引 导的序列模型; S6: 基
于图知识引导的序列模型生 成地理考题。 本发明
还提供一种基于知识引导的地理考题 生成装置,
用于实现所述的一种基于知识引导的地理考题
生成方法。 本发 明提供一种基于知识引导的地理
考题生成方法和装置, 解决了目前的机器自动命
题技术只能生成简单的地理考题的问题。
权利要求书4页 说明书12页 附图2页
CN 115455167 A
2022.12.09
CN 115455167 A
1.一种基于知识引导的地理考题生成方法, 其特 征在于, 包括以下步骤:
S1: 获取非结构化的地理知识文本语料构建地理文本语料库;
S2: 设置句法模板, 并根据句法模板从地理文本语料库识别得到相应的事理句子;
S3: 基于依存句法分析和语义角色标注的方式从事理句子中抽取地理事 件;
S4: 对地理事件进行泛化, 得到泛化后的地理事件, 并根据泛化后的地理事件构建结构
化的地理知识图谱;
S5: 根据结构化的地理知识图谱构建图知识引导的序列模型;
S6: 基于图知识引导的序列模型生成地理考题。
2.根据权利要求1所述的一种基于知识引导的地理考题生成方法, 其特征在于, 所述句
法模板包括:
由因到果前端式句法模板:
<Conj...>{Cause},{Ef fect};
由因到果居中 式句法模板:
{Cause}<Verb>{Ef fect};
由因到果居中配套式句法模板:
<Conj>{Cause}< Conj/Verb>{Ef fect};
由因到果前端配套式句法模板:
<Conj>{Cause}<Verb>,{Ef fect};
由果溯因居中 式句法模板:
{Effect}<Conj...>{Cause};
由果溯因配套式句法模板:
<Conj...>{Effect}<Conj...>{Cause};
由因到果居中配套三层因果关系式句法模板:
<Conj...>{Cause1}<verb>{effect1/Cause2},<verb>{effect2/cause3},<verb>
{effect3};
由因到果动词引导 三层因果关系式句法模板:
{Cause1}<verb>{ef fect1/Cause2},<verb>{ef fect2/cause3},<verb>{ef fect3};
由因到果前端配套动词引导 三层因果关系式句法模板:
<Conj>{Cause1}<Conj>,{Effect1/cause2},<verb>{effect2/cause3},<verb>
{effect3};
由因到果居中引导 二层因果关系式句法模板:
<Conj>{Cause1}< Conj/Verb>,{Ef fect1/cause2},<verb>{ef fect2};
由因到果前端配套动词引导 二层因果关系式句法模板:
<Conj>{Cause1}< Conj>,{Effect1/cause2},<verb>{ef fect2};
由因到果居中动词引导 二层因果关系式句法模板:
{Cause1}<verb>{ef fect1/Cause2},<verb>{ef fect2/cause2}。
3.根据权利要求2所述的一种基于知识引导的地理考题生成方法, 其特征在于, 步骤S3
的具体步骤为:
对任一事理句子, 先根据句法模板确定该事理句子中地理事件的触发词, 并通过语义权 利 要 求 书 1/4 页
2
CN 115455167 A
2角色标注识别该事理句子中地理事件的参与者, 然后通过依存句法分析识别该事理句子中
地理事件的主谓宾结构, 从而抽取 出该事理句子的地理事 件;
其中, 判断语义角色标注的结果中是否存在动作的施事者A0或动作的承受者A1;
如果存在A0, 则地理事件的主语用A0表示, 否则用依存句法结构SBV的依存子节点作 为
主语; 若依存句法结构 SBV也缺失, 则将地理事 件表示为动宾结构;
如果存在A1, 则地理事件的宾语用A 1表示, 否则用依存句法结构VOB的依存子节点作 为
宾语; 若依存句法结构VOB也 缺失, 则将地理事 件表示为主谓结构;
如果未出现动词, 则用名词表示 地理事件。
4.根据权利要求1所述的一种基于知识引导的地理考题生成方法, 其特征在于, 通过以
下步骤对地理事 件进行泛化:
S4.1: 采用地理文本语料库中出现频率最高的句法组合对地理事件进行抽象化, 得到
抽象地理事 件;
S4.2: 计算抽象地理事 件的余弦相似度;
S4.3: 根据余弦相似度对抽象地理事 件进行泛化:
若一抽象地理事件E至少存在5个相似抽象地理事件, 则提取抽象地理事件E及其相似
抽象地理事 件中的公共成分作为泛化后的地理事 件;
否则认为抽象地理事 件E缺少一般性而不泛化;
其中, 若两抽象地理事 件的相似度大于预设的相似度阈值则互为相似抽象地理事 件。
5.根据权利要求1所述的一种基于知识引导的地理考题生成方法, 其特征在于, 所述图
知识引导的序列模型包括图谱编码器、 K ‑BERT文本编码器和解码器; 先将步骤S4得到的地
理知识图谱输入图谱编 码器来把握地理知识图谱中的结构上下文信息, 以及将任意地理知
识文本语料输入 K‑BERT文本编 码器以捕捉文本的上下文信息, 然后利用解码 器生成相应的
地理考题。
6.根据权利要求5所述的一种基于知识引导的地理考题生成方法, 其特征在于, 所述图
谱编码器包括图谱预处 理单元和图转换 单元;
在所述图谱预处理单元中, 采用TransH方法将地理知识图谱的高维的谓词和实体表示
为低维的矩阵P和矩阵E; 通过训练矩阵P和矩阵E, 使所有事实(s ,r ,o)的总距离
最小; 其中, s表示头实体, r表示关系, o表示尾实体, es表示宾语实体
的语义向量, pr表示谓词的语义向量, eO表示主语实体的语义向量;
在所述图转换 单元中, 通过以下公式计算 抓取语义信息:
其中,
表示和注意力拼接后的编码信息, ei表示原始输入的编码信息, |表示N个attn
的连接操作, j∈N, at tnj为点积计算;
权 利 要 求 书 2/4 页
3
CN 115455167 A
3
专利 一种基于知识引导的地理考题生成方法和装置
文档预览
中文文档
19 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-03-03 12:13:44上传分享