iso file download
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210751626.0 (22)申请日 2022.06.29 (71)申请人 江苏昆山农村商业银行股份有限公 司 地址 215334 江苏省苏州市昆山市前进东 路828号 (72)发明人 杨立才 邵宏力 李云 邓知知  胡超 刘磊  (74)专利代理 机构 国浩律师(南京)事务所 32284 专利代理师 孟睿 (51)Int.Cl. G06F 16/21(2019.01) G06F 16/28(2019.01) G06F 16/22(2019.01)G06Q 40/02(2012.01) (54)发明名称 一种数据仓库主题模型构建方法和系统 (57)摘要 本发明涉及一种数据仓库主题模型构建方 法和系统。 将被外键引用且其自身不引用任何主 键的所有字段作为初步主节点, 一个初步主节点 对应一个初步主题; 对于某一初步主节点A, 如果 初步主节 点A不是其他任何初步主节 点的属性字 段, 或者是其他两个或两个以上初步主节点的属 性字段, 则将初步主节点A作为最优主节点, 该最 优主节点作为主题模型构建中的一个正式主题; 如果初步主节点A是其他某一个初步主节点B的 属性字段, 则将初步主节点A对应的初步主题合 并至初步主节点B对应的正式主题中。 本发明把 字段自动划分到不同的主题, 提高了主题建模准 确度和效率。 权利要求书2页 说明书14页 附图2页 CN 115292274 A 2022.11.04 CN 115292274 A 1.一种数据仓库主题模型构建方法, 其特征在于, 包括各表内函数依赖关系、 各表主 键、 外键以及外 键关系; 将被外键引用且其自身不引用任何主键的所有字段作为初步主节点, 一个初步主节点 对应一个初步主题; 确定各初步主节点的闭包, 初步主节点的闭包 包括以下字段: 通过初步主节点及其表内函数依赖关系推导出的所有字段; 初步主节点作为主键被引用的所有外 键字段; 以及 通过所述外键字段及其表内函数依赖关系推导出的所有字段; 其中, 将所述通过初步主节点及其表内函数依赖关系推导出的所有字段和所述通过外 键字段及其表内函数依赖关系推导出的所有字段作为初步主节点的属性字段; 对于某一初步主节点A, 如果初步主节点A不是其他任何初步主节点的属性字段, 或者是其他两个或两个以上 初步主节点的属性字段, 则将初步主节点A作为最优主节点, 该最优主节点作为主题模型构 建中的一个正式主题; 如果初步主节点A是其他某一个初步主节点B的属性字段, 则将初步主节点A对应的初 步主题合并至初步主节点B对应的正式主题中。 2.如权利要求1所述的数据仓库主题模型构建方法, 其特征在于, 当两个最优主节点的 字段同属于一张表时, 将两个最优主节点对应的主题合并为 一个主题。 3.如权利要求1或2所述的数据仓库主题模型构建方法, 其特征在于, 计算获得表内函 数依赖关系的过程 为: 获取数据库中各表的表名, 以及各表中的字段名; 针对各表, 根据表中字段的值, 分析各字段的特征; 以及针对各表, 根据表名、 字段名以 及字段的值, 计算获得表内各字段之间的函数依赖关系作为表内函数依赖关系; 所述字段的特征包括定性特征和定量特征; 所述定性特征包括字段的数据类型, 所述 定量特征包括字段的长度。 4.如权利要求3所述的数据仓库主题模型构建方法, 其特征在于, 形成外键关系的过程 为: 针对各表, 根据表内函数依赖关系识别出各表的主键, 并根据所述主键的特征在其他 表中寻找并确定与之对应的外 键, 在主键和外 键之间形成外 键关系。 5.如权利要求 4所述的数据仓库主题模型构建方法, 其特 征在于, 寻找并确定外键时, 将其他表中与主键数据类型和字段长度相匹配的字段作为外键, 所述与主键数据类型和字段长度相匹配的字段是指, 该字段的数据类型与主键数据类型相 同, 该字段的最小长度大于或等于主键的最小长度、 最大长度小于或等于主键的最大长度。 6.如权利要求1 ‑5任一权项所述的数据仓库主题模型构建方法, 其特征在于, 各步骤的 计算结果以表格形式存 储。 7.一种数据仓库主题模型构建系统, 其特 征在于, 包括: 处理器; 数据库; 以及存 储器, 其中存 储有程序, 其中在所述处 理器执行所述程序时, 进行以下操作: 获取数据库中的表数据; 计算获得各表内函数依赖关系、 各表主键、 外键以及外键关权 利 要 求 书 1/2 页 2 CN 115292274 A 2系; 将被外键引用且其自身不引用任何主键的所有字段作为初步主节点, 一个初步主节点 对应一个初步主题; 确定各初步主节点的闭包, 初步主节点的闭包 包括以下字段: 通过初步主节点及其表内函数依赖关系推导出的所有字段; 初步主节点作为主键被引用的所有外 键字段; 以及 通过所述外键字段及其表内函数依赖关系推导出的所有字段; 其中, 将所述通过初步主节点及其表内函数依赖关系推导出的所有字段和所述通过外 键字段及其表内函数依赖关系推导出的所有字段作为初步主节点的属性字段; 对于某一初步主节点A, 如果初步主节点A不是其他任何初步主节点的属性字段, 或者是其他两个或两个以上 初步主节点的属性字段, 则将初步主节点A作为最优主节点, 该最优主节点作为主题模型构 建中的一个正式主题; 如果初步主节点A是其他某一个初步主节点B的属性字段, 则将初步主节点A对应的初 步主题合并至初步主节点B对应的正式主题中。 8.如权利要求7所述的数据仓库主题模型构建系统, 其特征在于, 当两个最优主节点的 字段同属于一张表时, 将两个最优主节点对应的主题合并为 一个主题。 9.如权利要求7或8所述的数据仓库主题模型构建系统, 其特征在于, 计算获得表内函 数依赖关系的过程 为: 获取数据库中各表的表名, 以及各表中的字段名; 针对各表, 根据表中字段的值, 分析各字段的特征; 以及针对各表, 根据表名、 字段名以 及字段的值, 计算获得表内各字段之间的函数依赖关系作为表内函数依赖关系; 所述字段的特征包括定性特征和定量特征; 所述定性特征包括字段的数据类型, 所述 定量特征包括字段的长度。 10.如权利要求9所述的数据仓库主题模型构建系统, 其特征在于, 针对各表, 根据表内 函数依赖关系识别出各表的主键, 并根据所述主键的特征在其他表中寻找并确定与之对应 的外键, 在主键和外 键之间形成外 键关系; 寻找并确定外键时, 将其他表中与主键数据类型和字段长度相匹配的字段作为外键, 所述与主键数据类型和字段长度相匹配的字段是指, 该字段的数据类型与主键数据类型相 同, 该字段的最小长度大于或等于主键的最小长度、 最大长度小于或等于主键的最大长度。权 利 要 求 书 2/2 页 3 CN 115292274 A 3

.PDF文档 专利 一种数据仓库主题模型构建方法和系统

文档预览
中文文档 19 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种数据仓库主题模型构建方法和系统 第 1 页 专利 一种数据仓库主题模型构建方法和系统 第 2 页 专利 一种数据仓库主题模型构建方法和系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 06:18:53上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。