iso file download
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211249273.0 (22)申请日 2022.10.12 (71)申请人 江苏航运职业技术学院 地址 226000 江苏省南 通市经济技 术开发 区通盛大道185号 (72)发明人 周春煦 张建平 陈梨春 姜显贵  李丹 谢云飞 施峰 吉顺莉  赵苏政 倪飞 施小飞 戴雨  王兆能 曹野 郑玉能 仲文正  陆丁炜 鲍志鹏 成海峰 闵钰强  丁杨 曹毅 沈媛  (74)专利代理 机构 深圳天融专利代理事务所 (普通合伙) 44628 专利代理师 张莉(51)Int.Cl. G06K 9/62(2022.01) G06N 20/00(2019.01) (54)发明名称 应用于数字孪生城市的空间数据集成方法 及系统 (57)摘要 本发明公开了应用于数字孪生城市的空间 数据集成方法及系统, 涉及数字孪生城市技术领 域, 包括: 接收所有数据源的数据, 将数据源上传 至服务器中, 对多源数据进行检索和分析确定库 中的数据的量及格式; 识别库中的数据的主题, 将主题作为标签对分类后的数据进行标记; 对若 干个库的数值进行量化, 获取各个库的标准值, 以标准值对库进行量化评估; 依据数据格式之间 转换难度, 获取库的评估值; 获取库评估值PG, 依 据库评估值PG对所有的库进行排序; 依据库的排 序从库中依次获取数据; 通过获取格式难度值 GsN以及库的标准值BZ, 并获取到库评估 值PG, 依 据库评估值PG为若干个库进行排序, 确定 数据采 集策略, 在进行空间数据采集, 综合 程度高。 权利要求书3页 说明书9页 附图2页 CN 115329903 A 2022.11.11 CN 115329903 A 1.应用于数字 孪生城市的空间数据集成方法, 其特 征在于: 包括: 接收所有数据源的数据, 将数据源上传至服务器 中, 对多源数据进行检索和分析, 确定 库中的数据的量及格式; 识别库中的数据的主题, 将主题作为标签对分类后的数据进行 标记; 其中, 获取所有库中的主题标签数量, 计算主题标签的活跃度; 获取所有库中的主题标 签数量, 计算主题标签的贡献度; 计算库中主题标签与数据采集分析策略的主题的相似度, 获取相似度数据; 获取贡献度GxL、 相似度Xs及总活跃度ZhY, 进行归一化处理后, 关联汇总形成库标准 值, 记为库标准 值BZ; 其计算方式符合如下公式: 其中, , , 且 , 为权重, 其 具体值可由用户依据 实际经验进行调整及修正, 通过改变的 的数值, 来对库的标 准值BZ进行修 正; 对若干个库的数值进行量 化, 获取各个库的标准 值, 以标准 值对库进行量 化评估; 依据数据格式之间转换难度, 与 库的标准 值相关联, 获取库的评估值; 获取库评估值PG, 依据库评估值PG对所有的库进行排序; 在进行数据采集时, 依据库的 排序, 从库中依次获取 数据。 2.根据权利要求1所述的应用于数字 孪生城市的空间数据集成方法, 其特 征在于: 对多源数据中的格式进行识别, 确定各个库内的数据总量, 及库中数据的格 式信息; 依 据数据的格式信息, 对库中的数据进行分类, 形成不同的数据类别; 依据各个格式下的数据量的大小, 对各个数据类别次进行排序; 在获取到库中各个格 式的数据的总量后, 确定各个类别中的出现次数最多格式, 将其余若干格式向其中出现最 多的格式进行转换, 从而将本库中的格式统一 化; 通过训练过滤器, 利用训练后的数据 过滤器, 过滤库中的无效数据, 进而降低无效数据 或者空白数据在库中产生的噪声, 减少对正常数据的干扰。 3.根据权利要求1所述的应用于数字 孪生城市的空间数据集成方法, 其特 征在于: 从若干个库中的一个中, 选择出若干个数据, 分别作为主题提取训练集及主题模型测 试集; 以训练集对LDA主题模 型进行训练, 生成训练后LDA主题模型, 并利用主题测试集进 行 测试, 确定训练出的LDA主题模型 无误; 利用训练得到的LDA模型对库中的若干个数据进行主题提取, 获取若干个数据主题; 利用相似度模型, 判断不同主题间的相似度, 依据相似度对获取若干个主题进行分类; 依据主题名称生成主题标签, 将该主题标签添加在相应数据分类类别 中, 以主题标签 对该类别进行表征。 4.根据权利要求1所述的应用于数字 孪生城市的空间数据集成方法, 其特 征在于:权 利 要 求 书 1/3 页 2 CN 115329903 A 2以 表示库中主题标签的最近的活跃度; 以 表示主题标签代表的数据分类中的数据 主题在库中出现的总次数; 以 为库中的总数据量; 其表达式为, 为活跃度的修正系数, 其值大小由用户按照需求进行设置, 方便对库的主题标签的活 跃度进行修 正; 确定每个数据分类中的主题标签的数量及相应的活跃度, 汇总形成总活跃度, 记为总 活跃度Zh Y。 5.根据权利要求1所述的应用于数字 孪生城市的空间数据集成方法, 其特 征在于: 在数据类别的主题标签下, 所有的主题数量记为LtS, 该主题标签下的数据占库中数据 总量的百分比记为Zb; 主题标签贡献度为GxL; 贡献度GxL的计算方法 符合以下表达式: 其中, 为贡献度的修正系数, 其值大小由用户按照需求进行设置, 对库的主题标签的 贡献度进行修 正。 6.根据权利要求1所述的应用于数字 孪生城市的空间数据集成方法, 其特 征在于: 获取数据采集及分析的策略, 通过训练的LDA主题模型, 对策略进行主题提取, 获取到 策略主题; 从库中获取主题标签, 利用相似度模型, 判断库中的主题标签与策略主题的相似 度, 并对相似度的值进行量 化; 获取所有主题标签的量化后的相似度的值, 进行排序, 形成排序信 息; 获取库中所有的 主题标签的相似度, 并进行汇总, 获取 该库主题标签相似度的最大值, 确定为相似度Xs。 7.根据权利要求1所述的应用于数字 孪生城市的空间数据集成方法, 其特 征在于: 获取的各个库中内的数据格 式, 及相应的数据量, 确定格 式量数据; 依据格 式间的转换 难度, 对转换难度进 行评分, 获取不同格式之 间转换时评 分的均值, 以评 分均值对格式进 行 标记; 以评分均值与库中数据量的积作 为库的格 式难度值GsN, 并依据格 式难度值GsN对若干 个库进行排序; 将其他的若干个库的数据格式 向格式难度值GsN最低库的格式转换, 将若干 个库格式形成统一。 8.根据权利要求1所述的应用于数字 孪生城市的空间数据集成方法, 其特 征在于: 获取格式难度值G sN以及库的标准 值BZ, 将两者进行关联, 确定库评估值PG: 其中, 库的标准 值的计算方法如下: 其中, 为修正系数, 对库评估值PG进行修正, 及 在为权重系数, ,权 利 要 求 书 2/3 页 3 CN 115329903 A 3

.PDF文档 专利 应用于数字孪生城市的空间数据集成方法及系统

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 应用于数字孪生城市的空间数据集成方法及系统 第 1 页 专利 应用于数字孪生城市的空间数据集成方法及系统 第 2 页 专利 应用于数字孪生城市的空间数据集成方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 12:13:28上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。