iso file download
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211230711.9 (22)申请日 2022.10.09 (71)申请人 北京爱知之星科技股份有限公司 地址 100102 北京市朝阳区望京北路9号叶 青大厦D座801室 (72)发明人 赵欢 邢振 孙晓韩 刘备  夏昌吉  (74)专利代理 机构 北京棋拾知识产权代理事务 所(普通合伙) 11863 专利代理师 杨雪婷 (51)Int.Cl. G06F 16/34(2019.01) G06F 16/35(2019.01) G06F 40/30(2020.01) G06N 3/04(2006.01)G06N 3/08(2006.01) (54)发明名称 合同摘要的生 成方法和装置、 合同关键信息 提取模型的训练方法 (57)摘要 本申请公开了一种合同摘要的生成方法和 装置、 合同关键信息提取模型的训练方法。 该方 法包括: 获取目标合同文本以及针对目标合同文 本的问题文本; 根据目标合同文本的合同实体, 从语料库中获取与所述目标合同文本相关的关 键信息文档; 根据所述关键信息文档, 对所述目 标合同文本进行段落筛选处理, 获取所述目标合 同文本的多个文档段落; 采用神经网络模型对所 述文档段落和所述问题文本进行处理, 以获取针 对所述目标合同文本的目标合同关键信息; 根据 所述目标合同关键信息, 生 成针对所述目标合同 文本的合同摘要。 本申请实施例按用户所喜闻乐 见的格式生成合同摘要, 很大程度降低了人工提 炼合同摘要的成本, 提高了效率, 进而能够提高 用户阅读合同的效率。 权利要求书3页 说明书10页 附图3页 CN 115525757 A 2022.12.27 CN 115525757 A 1.一种合同摘要的生成方法, 包括: 获取目标合同文本以及针对所述目标合同文本的问题文本, 其中, 所述问题文本为用 户针对所述目标合同文本欲获取的信息要求; 根据所述目标合同文本的合同实体, 从语料库中获取与 所述目标合同文本相关的关键 信息文档; 根据所述关键信息文档, 对所述目标合同文本进行段落筛选处理, 获取所述目标合同 文本的多个文档段落; 采用神经网络模型对所述文档段落和所述问题文本进行处理, 以获取针对所述目标合 同文本的目标合同关键信息; 根据所述目标合同关键信息, 生成针对所述目标合同文本的合同摘要。 2.根据权利要求1所述的合同摘要的生成方法, 其中, 在所述采用神经网络模型对所述 文档段落和所述问题文本进行 处理, 以获取针对所述目标合同文本的目标合同关键信息之 前, 所述方法还 包括: 从所述问题文本中抽取关键词; 根据所述关键词, 采用标准问题库对所述问题文本进行 标准化处理。 3.根据权利要求1所述的合同摘要的生成方法, 其中, 所述采用神经网络模型对所述文 档段落和所述问题文本进行处理, 以获取针对所述 目标合同文本的目标合同关键信息, 包 括: 对所述文档段落和所述问题文本分别进行向量 化处理, 生成文档向量和问题向量; 对所述文档向量和所述问题向量分别进行特征提取处理, 生成文档特征向量和问题特 征向量; 对所述文档特征向量和所述问题特征向量进行注意力 计算, 获取所述文档段落和所述 问题文本中每 个词之间的相关度信息; 根据所述相关度信息, 采用边界模型 预测所述目标合同文本的目标合同关键信息 。 4.根据权利要求3所述的合同摘要的生成方法, 其中, 所述根据所述相关度信息, 采用 边界模型 预测所述目标合同文本的目标合同关键信息, 包括: 根据所述相关度信息, 采用边界模型 预测所述目标合同文本的候选答案片段; 计算所述文档段落的段落得分; 计算所述神经网络模型的模型 得分; 计算所述问题文本与所述 候选答案片段的问答相关度得分; 根据所述段落得分、 所述模型得分和所述问答相关度得分, 对所述候选答案片段进行 排序; 根据排序结果, 生成所述目标合同关键信息 。 5.根据权利要求1所述的合同摘要的生成方法, 其中, 所述方法还 包括: 获取多个合同文件数据; 对所述合同文件数据进行解析, 得到文本信息; 对所述文本信息进行 标注处理, 得到标注后的语料, 形成所述语料库。 6.根据权利要求1所述的合同摘要的生成方法, 其中, 所述方法还 包括: 采用所述语料库中的语料对所述神经网络模型进行训练。权 利 要 求 书 1/3 页 2 CN 115525757 A 27.根据权利要求1所述的合同摘要的生成方法, 其中, 所述根据所述目标合同关键信 息, 生成针对所述目标合同文本的合同摘要, 包括: 根据所述目标合同文本的合同类型信 息, 获取与 所述合同类型信 息对应的合同摘要模 板; 将所述目标合同关键信息填入所述 合同摘要模板, 得到所述 合同摘要。 8.一种合同摘要的生成装置, 包括: 预处理模块, 用于获取目标合同文本以及针对所述目标合同文本的问题文本, 其中, 所 述问题文本为用户针对所述目标合同文本欲获取的信息要求; 文档召回模块, 用于根据所述目标合同文本的合同实体, 从语料库中获取与所述目标 合同文本相关的关键信息文档; 段落筛选模块, 用于根据 所述关键信 息文档, 对所述目标合同文本进行段落筛选处理, 获取所述目标合同文本的多个文档段落; 阅读理解模块, 用于采用神经网络模型对所述文档段落和所述问题文本进行处理, 以 获取针对所述目标合同文本的目标合同关键信息; 摘要生成模块, 用于根据所述目标合同关键信息, 生成针对所述目标合同文本的合同 摘要。 9.一种合同关键信息提取模型的训练方法, 包括: 获取训练数据, 其中, 所述训练数据包括多组合同文本及与所述合同文本对应的问题 文本, 且所述 合同文本中标注有与所述问题文本对应的目标关键信息; 针对所述训练数据进行 下述迭代操作: 根据所述合同文本的合同实体, 从语料库中获取与所述合同文本相关的关键信息文 档; 根据所述关键信息文档, 对所述合同文本进行段落筛选处理, 获取所述合同文本的多 个文档段落; 采用神经网络模型对所述文档段落和所述问题文本进行处理, 以获取针对所述合同文 本的候选关键信息; 计算所述 候选关键信息与所述目标关键信息的匹配度; 当所述匹配度低于所述训练阈值, 调整所述神经网络模型的参数; 当所述匹配度不低于所述训练阈值, 和/或迭代次数超过预设次数阈值 时, 结束所述迭 代操作; 将采用最后 一轮迭代操作 所使用的参数的所述神经网络模型, 确定为所述合同关键信 息提取模型。 10.一种合同摘要的生成方法, 包括: 获取目标合同文本以及针对所述目标合同文本的问题文本, 其中, 所述问题文本为用 户针对所述目标合同文本欲获取的信息要求; 对所述目标合同文本进行解析, 以确定所述目标合同文本的合同类型; 根据所述合同类型获取对应的合同关键信 息提取模型, 其中所述对应的合同关键信 息 提取模型 是使用根据权利要求9所述的合同关键信息提取模型的训练方法获得的; 根据所述目标合同文本的合同实体, 从语料库中获取与 所述目标合同文本相关的关键权 利 要 求 书 2/3 页 3 CN 115525757 A 3

PDF文档 专利 合同摘要的生成方法和装置、合同关键信息提取模型的训练方法

文档预览
中文文档 17 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 合同摘要的生成方法和装置、合同关键信息提取模型的训练方法 第 1 页 专利 合同摘要的生成方法和装置、合同关键信息提取模型的训练方法 第 2 页 专利 合同摘要的生成方法和装置、合同关键信息提取模型的训练方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:13:40上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。