iso file download
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211109816.9 (22)申请日 2022.09.13 (71)申请人 苏州空天信息 研究院 地址 215000 江苏省苏州市苏州工业园区 独墅湖大道158 (72)发明人 岳才杰 王洋 付琨 刘亮 陶家顺 许浩 李思宁 潘巧林 王琳 王龙 (74)专利代理 机构 南京理工大 学专利中心 32203 专利代理师 封睿 (51)Int.Cl. G06F 16/33(2019.01) G06F 16/36(2019.01) G06F 40/211(2020.01)G06F 40/295(2020.01) G06F 40/30(2020.01) G06F 8/10(2018.01) (54)发明名称 一种结构化文档需求快速识别和条目化组 织管理方法 (57)摘要 本发明提出了一种结构化文档需求快速识 别和条目化组织管理方法, 将结构化或半结构化 软件需求文档中的文字元素和版面格式抽离, 并 按原文或者目标结构进行层次化组织管理; 对已 经层次化的需求段落文本进行识别, 获取需求语 句, 利用结构信息抽取出需求条目对应的属性候 选, 利用关联规则挖掘需求属性, 并基于实体注 意力的深度神经网络实体关系抽取模型抽取需 求实体的层次结构和关联关系; 从需求数据源中 提取出需求实体、 属性以及实体间的相互关系, 形成本体化的知识表达, 结合需求条目, 基于表 达体系抽取实体数据和实体关系, 完成需求数据 消岐和融合, 并将构建好的软件需求知识库以图 谱的形式进行展示。 本发明提高了软件需求分析 的效率。 权利要求书2页 说明书5页 附图2页 CN 115470319 A 2022.12.13 CN 115470319 A 1.一种结构化文档需求快速识别和条目化组织管理方法, 其特 征在于, 包括如下步骤: 步骤1, 将结构化或半结构化软件需求文档中的文字元素和版面格 式抽离, 并按原文或 者目标结构进行层次化组织管理; 步骤2, 基于自然语言识别方法和关键字提取方法, 结合软件需求知识库, 对已经层次 化的软件需求段落文本进行识别, 获取需求语句, 利用结构信息抽取出需求条目对应的属 性候选, 利用关联规则挖掘需求属 性, 并基于实体注意力的深度神经网络实体关系抽取模 型抽取需求实体的层次结构和关联关系; 步骤3, 从需求数据源中提取出需求实体、 属性以及实体间的相互关系, 形成本体化的 知识表达, 结合需求条目, 基于表达体系抽取实体数据和实体关系, 完成 需求数据消岐和融 合, 并将构建好的软件需求知识库以图谱的形式进行展示。 2.根据权利要求1所述的结构化文档需求快速识别和条目化组织管理方法, 其特征在 于, 步骤1, 将结构化或半结构化软件需求文档中的文字元素和版面格式抽离, 并按原文或 者目标结构进行层次化组织管理, 具体为: 基于jacob或Apache POI技术将软件需求文档内容进行结构化抽取, 对整个软件需求 文档从上至下扫描, 并对其中的文本和表格进行区分处理, 记录文本和表格的位置顺序, 其 中文档内的标题形成标题条目, 文档内的段落形成正文条目。 3.根据权利要求1所述的结构化软件需求文档需求快速识别和条目化组织管理方法, 其特征在于, 步骤2, 基于自然语言识别方法和关键字提取方法, 结合软件需求知识库, 对已 经层次化的软件需求段落文本进行识别, 获取需求语句, 利用结构信息抽取出需求条目对 应的属性候选, 利用关联规则挖掘需求属 性, 并基于实体注意力的深度神经网络实体关系 抽取模型抽取需求实体的层次结构和关联关系, 具体为: (1)需求文本条目化 基于自然语言处理语义分析技术, 对软件需求文档中的需求文本进行语法、 词法、 语 用、 语境分析, 将 需求文本进行段落拆分; 再结合关键字识别技术, 对拆分的需求段落进行 关键字提取, 并结合软件需求知识库, 拆 分成不同的需求语句, 并基于需求语句生成 需求文 本条目; (2)需求条目属性抽取 基于直接属性抽取和基于关联语义链的语义属性抽方法, 从多层次多角度的数据源中 采集软件需求条目的属性信息, 实现对需求条目知识的整体勾画, 包括: 所属项目、 所属模 块、 需求内容、 需求条目来源、 对应的文档、 需求版本、 类型、 状态、 条目标识、 采集人、 采集时 间、 审批人, 为需求条目关系的抽取、 需求知识的融合、 表达提供基础和实现的载体; 其中直接属性抽取是利用数据挖掘, 从不同来源的结构化、 半结构化的软件需求文本 中抽取需求条目属 性知识, 基于关联语义链的语义属 性抽取利用实体的关联语义链, 抽取 与需求条目关联的语义词语作为属性; (3)需求条目关系抽取 基于实体注意力的深度神经网络实体关系抽取模型抽取软件需求条目的关系, 包括: 软件需求条目的分类层次关系、 部分 ‑整体关系、 相似关系以及属 性关系, 其中属性关系通 过软件需求条目属 性抽取的方法得到, 部分 ‑整体关系和分类层次关系为软件需求条目的 is‑a关系, 而相似关系是 软件需求条目文本的外形相似 且具备搜索相关性。权 利 要 求 书 1/2 页 2 CN 115470319 A 24.根据权利要求3所述的结构化文档需求快速识别和条目化组织管理方法, 其特征在 于, 所述需求条目属性抽取中, 对于结构化、 半结构化软件需求文本, 首先利用结构信息抽 取出需求条目对应的属性候选, 然后利用关联规则挖掘Apr iori算法, 选取置信度高的候选 作为需求条目对应的属性。 5.根据权利要求3所述的结构化文档需求快速识别和条目化组织管理方法, 其特征在 于, 所述需求条目属性抽取中, 对于软件需求文档中非结构化需求文本, 首先利用句法分析 对需求文本进行处理, 利用实体识别结果、 句法分析结果和属 性词典产生每个需求条目对 应的属性候选, 然后融合句法语义特征、 候选属性本身的语义特征、 候选属性与需求条目间 的相对位置特 征来对每 个候选属性进行打 分, 分值高的属性 候选即为抽取 结果。 6.根据权利要求3所述的结构化文档需求快速识别和条目化组织管理方法, 其特征在 于, 所述需求条目关系抽取中, 基于实体注意力的深度神经网络实体关系抽取模 型, 首先采 用双向LSTM对需求 实体所在的文本的上下文进 行建模, 随后利用实体注意力模 型对辨别语 义关系过程中起不同作用的语义特征分配不同权重, 然后 将不同需求实体相关特征的计算 结果通过softmax 归一化映射为每一类 语义关系对应的概 率。 7.一种结构化文档需求快速识别和条目化组织管理系统, 其特征在于, 基于权利要求 1‑6任一项所述的结构化文档需求快速识别和条目化组织管理方法, 实现结构化软件需求 文档中需求的快速识别和条目化组织管理。 8.一种计算机设备, 包括存储器、 处理器及存储在存储器上并可在处理器上运行的计 算机程序, 所述处理器执行所述计算机程序时, 基于权利要求 1‑6任一项所述的结构化文档 需求快速识别和条目化组织管理方法, 实现结构化软件需求文档)中需求的快速识别和条 目化组织管理。 9.一种计算机可读存储介质, 其上存储有计算机程序, 所述计算机程序被处理器执行 时, 基于权利要求 1‑6任一项所述的结构化文档需求快速识别和条目化组织管 理方法, 实现 结构化软件需求文档中 需求的快速识别和条目化组织管理。权 利 要 求 书 2/2 页 3 CN 115470319 A 3
专利 一种结构化文档需求快速识别和条目化组织管理方法
文档预览
中文文档
10 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助3元下载(无需注册)
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助3元下载
本文档由 SC 于
2024-03-03 12:13:52
上传分享
举报
下载
原文档
(600.3 KB)
分享
友情链接
GB-T 40482-2021 城市发展质量评价指标.pdf
赛迪 数据安全治理白皮书 2021.pdf
NIST.SP.800-53Ar4 Assessing Security and Privacy Controls in Federal Information Systems and Organizations.pdf
GB-T 16638.4-2008 空气动力学 概念、量和符号 第4部分:飞机的空气动力、力矩及其系数和导数.pdf
GB-T 22264.6-2009 安装式数字显示电测量仪表 第6部分:绝缘电阻表的特殊要求.pdf
GB-T 24354-2023 公共地理信息通用地图符号.pdf
T-CAEPI 66—2023 水污染源自动监控监测系统 运行维护技术指南.pdf
GB-T 3716-2023 托盘术语.pdf
GB-T 17873-2014 纯氖和高纯氖.pdf
GB-T 36465-2018 网络终端操作系统总体技术要求.pdf
TB-T 3481-2017 铁路低压母联备投自动转换开关电器.pdf
GB-T 25808-2021 硫化黑2BR、3B 200%.pdf
中国电信 数字道路白皮书 2022.pdf
T-GHDQ 88.2—2022 车辆无线通信信息安全测试规范 第2部分:车载WLAN安全测试规范.pdf
CJ-T 270-2017 CJT 270-2017 聚乙烯塑钢缠绕排水管及连接件-232815 - 复件.pdf
DB52-T 1558-2021 大数据安全服务人员能力评价 贵州省.pdf
AQ-T 3046-2013 化工企业定量风险评价导则.pdf
上海市重大行政决策程序规定.pdf
GB-T 18226-2015 公路交通工程钢构件防腐技术条件.pdf
GB-T 21062.4-2007 政务信息资源交换体系 第4部分:技术管理要求.pdf
1
/
10
评价文档
赞助3元 点击下载(600.3 KB)
回到顶部
×
微信扫码支付
3
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。