iso file download
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210654616.5 (22)申请日 2022.06.10 (71)申请人 中国银行股份有限公司 地址 100818 北京市西城区复兴门内大街1 号 (72)发明人 罗欣 张燕  (74)专利代理 机构 北京集佳知识产权代理有限 公司 11227 专利代理师 韩丽波 (51)Int.Cl. G06Q 40/02(2012.01) G06K 9/62(2022.01) (54)发明名称 一种金融信贷风险识别方法、 装置及设备 (57)摘要 本申请公开了一种金融信贷风险识别方法、 装置及设备, 可应用于人工智能领域以及金融领 域, 能够利用基于PCA特征选择和随机森林算法 构建的金融信贷风险识别模型, 实现对金融信贷 风险的快速、 准确识别, 大幅度提高了金融信贷 风险识别结果的准确率和识别效率。 该方法包 括: 首先获取待识别的目标用户的信贷数据; 其 中, 信贷数据包含目标用户的基础信息数据和信 贷信息数据, 然后对目标用户的基础信息数据和 信贷信息 数据进行特征提取, 得到目标用户对应 的特征向量, 接着将目标用户对应的特征向量输 入至预先构建的金融信贷风险识别模 型, 得到目 标用户对应的金融信贷风险识别结果; 其中, 金 融信贷风险识别模型是基于PCA特征选择和随机 森林算法构建的。 权利要求书2页 说明书9页 附图1页 CN 114971875 A 2022.08.30 CN 114971875 A 1.一种金融信贷风险识别方法, 其特 征在于, 所述方法包括: 获取待识别的目标用户的信贷数据; 所述信贷数据包含所述目标用户的基础信 息数据 和信贷信息数据; 对所述目标用户的基础信 息数据和信贷信 息数据进行特征提取, 得到所述目标用户对 应的特征向量; 将所述目标用户对应的特征向量输入至预先构建的金融信贷风险识别模型, 得到所述 目标用户对应的金融信贷风险识别结果; 所述金融信贷风险识别模型是基于主成分分析 PCA特征选择和随机森林算法构建的。 2.根据权利要求1所述的方法, 其特征在于, 所述金融信贷风险识别模型的构建方式如 下: 获取样本用户的样本信贷数据; 所述样本数据包含所述样本用户的基础信 息数据和样 本信贷信息数据; 对样本用户的基础信 息数据和样本信贷信 息数据进行特征提取, 得到所述样本用户的 对应的样本特 征向量; 利用PCA方法对所述样本特征向量进行特征选择, 降维生成互不相关的样本综合特征 变量; 利用随机森林算法和所述样本综合特征变量对初始金融信贷风险识别模型进行训练, 生成随机森林模型, 作为金融信贷风险识别模型。 3.根据权利要求2所述的方法, 其特征在于, 当所述样本特征向量为N维时, N为大于1的 正整数; 所述利用P CA方法对所述样 本特征向量进 行特征选择, 降维生 成互不相关的综合特 征变量, 包括: 利用PCA方法将对具有所述N维的样本特征向量的样本信贷数据进行正交变换, 转换成 为具有互不相关的M维的样本综合特征变量的样本信贷数据; 所述M为大于1的正整数, 且N 的取值大于 M的取值。 4.根据权利要求3所述的方法, 其特征在于, 所述利用随机森林算法和所述样本综合特 征变量对初始金融信贷风险识别模型进行训练, 生成随机森林模型, 作为金融信贷风险识 别模型, 包括: S1: 对所述具有互不相关的M维的样本综合特征变量的样本信贷数据进行有放回的随 机抽样, 每抽取出一个M维的样本综合特征变量所对应的样本信贷数据均作为一份训练样 本数据, 直至抽取 出K份训练样本数据; 所述K为大于1的正整数, 且K的取值远大于 M的取值; S2: 利用所述K份训练样本数据训练得到一颗决策树模型; 所述决策树模型为初始金融 信贷风险识别模型; S3: 重复执 行步骤S1 ‑S2, 直至训练得到预设数量的决策树模型; S4: 利用所述预设数量的决策树模型, 通过对预设参数进行调优, 生成随机森林模型, 作为金融信贷风险识别模型。 5.一种金融信贷风险识别装置, 其特 征在于, 所述装置包括: 第一获取单元, 用于获取待识别的目标用户的信贷数据; 所述信贷数据包含所述目标 用户的基础信息数据和信贷信息数据; 第一提取单元, 用于对所述目标用户的基础信息数据和信贷信息数据进行特征提取,权 利 要 求 书 1/2 页 2 CN 114971875 A 2得到所述目标用户对应的特 征向量; 识别单元, 用于将所述目标用户对应的特征向量输入至预先构建的金融信贷风险识别 模型, 得到所述目标用户对应的金融信贷风险识别结果; 所述金融信贷风险识别模型是基 于主成分 分析PCA特 征选择和随机森林算法构建的。 6.根据权利要求5所述的装置, 其特 征在于, 所述装置还 包括: 第二获取单元, 用于获取样本用户的样本信贷数据; 所述样本数据包含所述样本用户 的基础信息数据和样本信贷信息数据; 第二提取单元, 用于对样本用户的基础信息数据和样本信贷信息数据进行特征提取, 得到所述样本用户的对应的样本特 征向量; 降维单元, 用于利用PCA方法对所述样本特征向量进行特征选择, 降维生成互不相关的 样本综合特 征变量; 训练单元, 用于利用随机森林算法和所述样本综合特征变量对初始金融信贷风险识别 模型进行训练, 生成随机森林模型, 作为金融信贷风险识别模型。 7.根据权利要求6所述的装置, 其特征在于, 当所述样本特征向量为N维时, N为大于1的 正整数; 所述降维单 元具体用于: 利用PCA方法将对具有所述N维的样本特征向量的样本信贷数据进行正交变换, 转换成 为具有互不相关的M维的样本综合特征变量的样本信贷数据; 所述M为大于1的正整数, 且N 的取值大于 M的取值。 8.根据权利要求7 所述的装置, 其特 征在于, 所述训练单 元包括: 抽取子单元, 用于对所述具有互不相关的M维的样本综合特征变量的样本信贷数据进 行有放回的随机抽样, 每抽取出一个M维的样本综合特征变量所对应的样本信贷数据均作 为一份训练样本数据, 直至抽取出K份训练样 本数据; 所述K为大于1的正整 数, 且K的取值远 大于M的取值; 第一训练子单元, 用于利用所述K份训练样本数据训练得到一颗决策树模型; 所述决策 树模型为初始金融信贷风险识别模型; 第一训练子单元, 用于重复调用执行抽取子单元和第一训练子单元, 直至训练得到预 设数量的决策树模型; 生成子单元, 用于利用所述预设数量的决策树模型, 通过对预设参数进行调优, 生成随 机森林模型, 作为金融信贷风险识别模型。 9.一种金融信贷风险识别设备, 其特 征在于, 包括: 处 理器、 存储器、 系统总线; 所述处理器以及所述存 储器通过 所述系统总线相连; 所述存储器用于存储一个或多个程序, 所述一个或多个程序包括指令, 所述指令当被 所述处理器执行时使所述处 理器执行权利要求1 ‑4任一项所述的方法。 10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质中存储有指令, 当所述指令在终端设备 上运行时, 使得 所述终端设备 执行权利要求1 ‑4任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 114971875 A 3

.PDF文档 专利 一种金融信贷风险识别方法、装置及设备

文档预览
中文文档 13 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种金融信贷风险识别方法、装置及设备 第 1 页 专利 一种金融信贷风险识别方法、装置及设备 第 2 页 专利 一种金融信贷风险识别方法、装置及设备 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 06:20:07上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。