iso file download
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211156388.5 (22)申请日 2022.09.19 (71)申请人 北京语言大 学 地址 100000 北京市海淀区学院路15号 (72)发明人 荀恩东 王贵荣  (74)专利代理 机构 北京智沃 律师事务所 1 1620 专利代理师 梁晨 (51)Int.Cl. G06F 40/30(2020.01) G06F 40/289(2020.01) G06F 40/268(2020.01) G06F 16/901(2019.01) (54)发明名称 一种以事 件为核心的语义表示方法 (57)摘要 本发明提供一种以事件为核心的语义表示 方法, 是一种句子的语义表示方法, 从形式来看, 语义图主要由节点和边组成, 节 点表示句子中的 词语或概念, 边表示它们之间的关系; 从内容来 看, 语义图主要由两部分构成: 事件结构与实体 结构。 所述事件 结构与实体结构表 示的内容抽象 为单元、 关系、 属性三个方面, 通过构建单元、 单 元属性以及单元间关系的语义图, 来实现机器对 自然语言的理解。 本发明既能够对语 言现象进行 一致性表 示, 同时, 具有可计算的操作路径, 并能 够便捷地进行落 地应用。 权利要求书2页 说明书8页 附图9页 CN 115438673 A 2022.12.06 CN 115438673 A 1.一种以事 件为核心的语义表示方法, 包括以下步骤: S1: 确定语义图中的事件结构与实体结构, 事件结构和实体结构分别对应谓词性成分 和体词性成分在句法位置上 的语义功能, 用事件结构表示谓词性成分的陈述功能, 对特定 的过程、 性质或状态进 行断言; 用实体结构表示名词等体词性成分的指称功能, 指特定的事 物概念; S2: 所述事件结构通过事件词作为形式代表, 事件词对应的核心要素包括核心论元、 边 缘论元、 属性信息; S3: 确定事件节点与其核心要素之间的语义关系, 语义关系的具体类别在弧上进行说 明; S4: 确定实体结构的属性信息, 以有向弧指向事 件节点。 2.根据权利要求1所述的以事件为核心的语义表示方法, 其特征在于: 步骤S1中, 所述 语义图为单根有向图, 设置有一个ROOT根节点, 句子中的核心谓词 与根节点连接, 节 点对应 承载实体和事件的语言单元, 边为有向边, 表示事件与实体、 事件与事件、 实体与实体之间 的语义关系, 有向边上 标出关系标签或属性名, 由被支配节点指向支配节点。 3.根据权利要求1所述的以事件为核心的语义表示方法, 其特征在于: 步骤S2中, 在事 件结构中, 所述核心 论元指在句法上占据主/宾语位置, 在语义上与事件直接相关的语义角 色, 事件词的核心论元采用左方向的输入。 4.根据权利要求1所述的以事件为核心的语义表示方法, 其特征在于: 步骤S2中, 在事 件结构中, 所述边缘论元信息用介词、 方位词格标记引导, 事件词的边缘论元采用上方向的 输入。 5.根据权利要求1所述的以事件为核心的语义表示方法, 其特征在于: 步骤S2中, 在事 件结构中, 所述情态信息以句法成分为单位, 事 件词的情态信息采用下 方向的输入。 6.根据权利要求1所述的以事件为核心的语义表示方法, 其特征在于: 步骤S2中, 在事 件结构中, 还包括事件词的事件外结构, 采用右方向的输出, 所述事件外结构是指当前事件 词充当其他事件词的输入, 其它事件词有四种类型, 一是ROOT节 点作事件词, 二是能够带谓 主、 谓宾的事 件词, 三是表示事 件关系的事 件词, 四是表示隐式关系的事 件词。 7.根据权利要求6所述的以事件为核心的语义表示方法, 其特征在于: 所述ROOT节点作 事件词的类型中, 若当前谓词为核心事件谓词, 其右侧则与ROOT节 点连接, 核心事件谓词是 指句子中充当述语的核心谓词。 8.根据权利要求1所述的以事件为核心的语义表示方法, 其特征在于: 步骤S4中, 实体 结构包括实体内结构与实体外结构, 实体内结构由句 子中实体及其修饰性成分构成, 由主 宾语的中心语来充当; 实体外结构承载该实体与其他实体或事件之间的关系, 充当事件谓 词的论元。 9.根据权利要求1所述的以事件为核心的语义表示方法, 其特征在于: 所述语义表示方 法具有可计算路径, 通过构建单元、 单元属 性以及单元间关系来生成最终语义图或语义子 图。 主要包括以下几个步骤: S11: 输入文本进行网格初始化; S12: 利用组块依存 模型对输入文本进行组块分析, 并将分析 结果添加到网格中; S13: 利用词典型 数据表为网格单 元添加与应用场景相关的属性信息;权 利 要 求 书 1/2 页 2 CN 115438673 A 2S14: 利用关系型 数据表构建候选语义 三元组; S15: 利用事 件论元模型构建候选语义 三元组; S16: 利用有限状态自动机、 语言学规则和数据表为 三元组构建特 征集; S17: 利用多元 特征决策模型对候选三元组进行打 分, 优选分数较高的三元组; S18: 根据应用需求, 输出完整的语义表示图或其子图。 10.根据权利要求1所述的以事件为核心的语义表示方法, 其特征在于: 所述事件结构 是小句的核心, 一个小句中有一个或多个核心事件谓词, 当语义图用来表示段落或篇章的 语言单位的语义时, 段落或篇 章中每个小句的根节点 也看做一个事 件谓词。权 利 要 求 书 2/2 页 3 CN 115438673 A 3

PDF文档 专利 一种以事件为核心的语义表示方法

文档预览
中文文档 20 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种以事件为核心的语义表示方法 第 1 页 专利 一种以事件为核心的语义表示方法 第 2 页 专利 一种以事件为核心的语义表示方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:13:48上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。