iso file download
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211109816.9 (22)申请日 2022.09.13 (71)申请人 苏州空天信息 研究院 地址 215000 江苏省苏州市苏州工业园区 独墅湖大道158 (72)发明人 岳才杰 王洋 付琨 刘亮  陶家顺 许浩 李思宁 潘巧林  王琳 王龙  (74)专利代理 机构 南京理工大 学专利中心 32203 专利代理师 封睿 (51)Int.Cl. G06F 16/33(2019.01) G06F 16/36(2019.01) G06F 40/211(2020.01)G06F 40/295(2020.01) G06F 40/30(2020.01) G06F 8/10(2018.01) (54)发明名称 一种结构化文档需求快速识别和条目化组 织管理方法 (57)摘要 本发明提出了一种结构化文档需求快速识 别和条目化组织管理方法, 将结构化或半结构化 软件需求文档中的文字元素和版面格式抽离, 并 按原文或者目标结构进行层次化组织管理; 对已 经层次化的需求段落文本进行识别, 获取需求语 句, 利用结构信息抽取出需求条目对应的属性候 选, 利用关联规则挖掘需求属性, 并基于实体注 意力的深度神经网络实体关系抽取模型抽取需 求实体的层次结构和关联关系; 从需求数据源中 提取出需求实体、 属性以及实体间的相互关系, 形成本体化的知识表达, 结合需求条目, 基于表 达体系抽取实体数据和实体关系, 完成需求数据 消岐和融合, 并将构建好的软件需求知识库以图 谱的形式进行展示。 本发明提高了软件需求分析 的效率。 权利要求书2页 说明书5页 附图2页 CN 115470319 A 2022.12.13 CN 115470319 A 1.一种结构化文档需求快速识别和条目化组织管理方法, 其特 征在于, 包括如下步骤: 步骤1, 将结构化或半结构化软件需求文档中的文字元素和版面格 式抽离, 并按原文或 者目标结构进行层次化组织管理; 步骤2, 基于自然语言识别方法和关键字提取方法, 结合软件需求知识库, 对已经层次 化的软件需求段落文本进行识别, 获取需求语句, 利用结构信息抽取出需求条目对应的属 性候选, 利用关联规则挖掘需求属 性, 并基于实体注意力的深度神经网络实体关系抽取模 型抽取需求实体的层次结构和关联关系; 步骤3, 从需求数据源中提取出需求实体、 属性以及实体间的相互关系, 形成本体化的 知识表达, 结合需求条目, 基于表达体系抽取实体数据和实体关系, 完成 需求数据消岐和融 合, 并将构建好的软件需求知识库以图谱的形式进行展示。 2.根据权利要求1所述的结构化文档需求快速识别和条目化组织管理方法, 其特征在 于, 步骤1, 将结构化或半结构化软件需求文档中的文字元素和版面格式抽离, 并按原文或 者目标结构进行层次化组织管理, 具体为: 基于jacob或Apache  POI技术将软件需求文档内容进行结构化抽取, 对整个软件需求 文档从上至下扫描, 并对其中的文本和表格进行区分处理, 记录文本和表格的位置顺序, 其 中文档内的标题形成标题条目, 文档内的段落形成正文条目。 3.根据权利要求1所述的结构化软件需求文档需求快速识别和条目化组织管理方法, 其特征在于, 步骤2, 基于自然语言识别方法和关键字提取方法, 结合软件需求知识库, 对已 经层次化的软件需求段落文本进行识别, 获取需求语句, 利用结构信息抽取出需求条目对 应的属性候选, 利用关联规则挖掘需求属 性, 并基于实体注意力的深度神经网络实体关系 抽取模型抽取需求实体的层次结构和关联关系, 具体为: (1)需求文本条目化 基于自然语言处理语义分析技术, 对软件需求文档中的需求文本进行语法、 词法、 语 用、 语境分析, 将 需求文本进行段落拆分; 再结合关键字识别技术, 对拆分的需求段落进行 关键字提取, 并结合软件需求知识库, 拆 分成不同的需求语句, 并基于需求语句生成 需求文 本条目; (2)需求条目属性抽取 基于直接属性抽取和基于关联语义链的语义属性抽方法, 从多层次多角度的数据源中 采集软件需求条目的属性信息, 实现对需求条目知识的整体勾画, 包括: 所属项目、 所属模 块、 需求内容、 需求条目来源、 对应的文档、 需求版本、 类型、 状态、 条目标识、 采集人、 采集时 间、 审批人, 为需求条目关系的抽取、 需求知识的融合、 表达提供基础和实现的载体; 其中直接属性抽取是利用数据挖掘, 从不同来源的结构化、 半结构化的软件需求文本 中抽取需求条目属 性知识, 基于关联语义链的语义属 性抽取利用实体的关联语义链, 抽取 与需求条目关联的语义词语作为属性; (3)需求条目关系抽取 基于实体注意力的深度神经网络实体关系抽取模型抽取软件需求条目的关系, 包括: 软件需求条目的分类层次关系、 部分 ‑整体关系、 相似关系以及属 性关系, 其中属性关系通 过软件需求条目属 性抽取的方法得到, 部分 ‑整体关系和分类层次关系为软件需求条目的 is‑a关系, 而相似关系是 软件需求条目文本的外形相似 且具备搜索相关性。权 利 要 求 书 1/2 页 2 CN 115470319 A 24.根据权利要求3所述的结构化文档需求快速识别和条目化组织管理方法, 其特征在 于, 所述需求条目属性抽取中, 对于结构化、 半结构化软件需求文本, 首先利用结构信息抽 取出需求条目对应的属性候选, 然后利用关联规则挖掘Apr iori算法, 选取置信度高的候选 作为需求条目对应的属性。 5.根据权利要求3所述的结构化文档需求快速识别和条目化组织管理方法, 其特征在 于, 所述需求条目属性抽取中, 对于软件需求文档中非结构化需求文本, 首先利用句法分析 对需求文本进行处理, 利用实体识别结果、 句法分析结果和属 性词典产生每个需求条目对 应的属性候选, 然后融合句法语义特征、 候选属性本身的语义特征、 候选属性与需求条目间 的相对位置特 征来对每 个候选属性进行打 分, 分值高的属性 候选即为抽取 结果。 6.根据权利要求3所述的结构化文档需求快速识别和条目化组织管理方法, 其特征在 于, 所述需求条目关系抽取中, 基于实体注意力的深度神经网络实体关系抽取模 型, 首先采 用双向LSTM对需求 实体所在的文本的上下文进 行建模, 随后利用实体注意力模 型对辨别语 义关系过程中起不同作用的语义特征分配不同权重, 然后 将不同需求实体相关特征的计算 结果通过softmax 归一化映射为每一类 语义关系对应的概 率。 7.一种结构化文档需求快速识别和条目化组织管理系统, 其特征在于, 基于权利要求 1‑6任一项所述的结构化文档需求快速识别和条目化组织管理方法, 实现结构化软件需求 文档中需求的快速识别和条目化组织管理。 8.一种计算机设备, 包括存储器、 处理器及存储在存储器上并可在处理器上运行的计 算机程序, 所述处理器执行所述计算机程序时, 基于权利要求 1‑6任一项所述的结构化文档 需求快速识别和条目化组织管理方法, 实现结构化软件需求文档)中需求的快速识别和条 目化组织管理。 9.一种计算机可读存储介质, 其上存储有计算机程序, 所述计算机程序被处理器执行 时, 基于权利要求 1‑6任一项所述的结构化文档需求快速识别和条目化组织管 理方法, 实现 结构化软件需求文档中 需求的快速识别和条目化组织管理。权 利 要 求 书 2/2 页 3 CN 115470319 A 3

PDF文档 专利 一种结构化文档需求快速识别和条目化组织管理方法

文档预览
中文文档 10 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种结构化文档需求快速识别和条目化组织管理方法 第 1 页 专利 一种结构化文档需求快速识别和条目化组织管理方法 第 2 页 专利 一种结构化文档需求快速识别和条目化组织管理方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:13:52上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。