(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211388148.8
(22)申请日 2022.11.08
(71)申请人 中国科学院大学
地址 100190 北京市怀柔区雁栖湖东路1号
(72)发明人 李建平 郝俊 袁佳鑫
(74)专利代理 机构 北京卫智易创专利代理事务
所(普通合伙) 16015
专利代理师 朱春野
(51)Int.Cl.
G06Q 30/02(2012.01)
G06N 20/00(2019.01)
(54)发明名称
基于谱聚类的价格指数动态优化集成预测
方法
(57)摘要
本发明实施例公开了基于谱聚类的价格指
数动态优化集成预测方法, 包 括步骤: S1、 获取待
预测的价格标的及相应的输入特征; S2、 将价格
标的与输入特征转换为单体预测模型算法可读
的数据结构; S3、 将得到的数据结构划分为训练
集、 验证集和测试集; S4、 选择单体预测模型, 组
成备选单体预测模型库; S5、 利用训练集数据对
选取的单体预测模型分别进行训练, 获得样本外
的预测结果; S6、 在验证集上, 利用多目标规划确
定最佳的集成权重, 并利用网格搜索确定最佳的
窗口大小; S7、 在测试集上, 对滑动窗口内的数据
进行聚类; 选取与滑动窗口内最后一个观测点数
据结构相同的簇作为单体模型评估的数据基础;
S8、 确定最佳的集成权 重, 构建谱聚类模型。
权利要求书3页 说明书13页 附图4页
CN 115545803 A
2022.12.30
CN 115545803 A
1.基于谱聚类的价格指数动态优化 集成预测方法, 其特 征在于, 该 方法包括 步骤:
S1、 获取待预测的价格标的及相应的输入特 征;
S2、 将价格标的与输入特 征转换为单体预测模型算法可读的数据结构;
S3、 将得到的数据结构划分为训练集、 验证集和 测试集;
S4、 选择单体预测模型, 组成备选单体预测模型库;
S5、 利用训练集数据对选取的单体预测模型分别进行训练, 获得样本 外的预测结果;
S6、 在验证集上, 利用多目标规划确定最佳的集成权重, 并利用网格搜索确定最佳的滑
动窗口大小;
S7、 在测试集上, 基于最佳的滑动窗口参数, 对滑动窗口内的数据使用谱聚类方法进行
聚类; 然后, 选取与滑动窗口内最后一个观测 点数据结构相同的簇作为后续单体模型评估
的数据基础;
S8、 基于聚类方法获得的具有针对性的数据集和谱聚类算法, 确定最佳的集成权重, 构
建谱聚类模型。
2.根据权利要求1所述的基于谱聚类的价格指数动态优化集成预测方法, 其特征在于,
所述步骤S5具体包括:
S501、 从单体预测模型库中选择一定数量的单体预测模型;
S502、 利用训练集数据对选择的单体预测模型进行训练、 拟合, 得到单体预测模型;
S503、 利用训练好的单体预测模型对测试集的数据进行样本外预测, 得到若干列预测
结果。
3.根据权利要求2所述的基于谱聚类的价格指数动态优化集成预测方法, 其特征在于,
所述步骤S6具体包括:
S601、 在验证集数据上, 利用智能优化算法确定该窗口内每个单体预测模型的最佳权
重并作为下一期的权 重值, 利用该权 重值计算得到该时刻下的预测误差;
S602、 随着窗口滑动, 得到在该窗口下训练集样本的平均累加预测误差平方和。
4.根据权利要求3所述的基于谱聚类的价格指数动态优化集成预测方法, 其特征在于,
所述步骤S602具体包括:
设置不同步长, 观察不同窗口下平均累计误差平方和的变化, 选择最小的平均累计误
差平方, 所对应的窗口长度为 最佳窗口大小。
5.根据权利要求1所述的基于谱聚类的价格指数动态优化集成预测方法, 其特征在于,
步骤S4中所述的单体预测模型包括指数平滑模型、 自回归综合移动平均模型、 支持向量机
模型、 相关向量机模型、 前馈神经网络模型、 广义回归神经网络模型、 Elman神经网络模型、
极限学习机模型、 随机森林模型和长短期记 忆模型。
6.根据权利要求1所述的基于谱聚类的价格指数动态优化集成预测方法, 其特征在于,
步骤S7包括:
S701、 利用验证集的数据对 谱聚类方法中的聚类中心数参数进行优化;
S702、 结合获得的聚类中心数参数, 在测试集中对给定滑动窗口内的数据进行聚类分
析;
S703、 选择滑动窗口中最后一期数据所在的簇作为后续单体模型评估的数据基础。
7.根据权利要求1所述的基于谱聚类的价格指数动态优化集成预测方法, 其特征在于,权 利 要 求 书 1/3 页
2
CN 115545803 A
2步骤S8包括:
S801、 在聚类方法获得的具有针对性的数据集上, 测验训练好的单体预测模型在当期
的表现, 得到相应的预测结果;
S802、 在最佳滑动窗口下, 利用NSGA ‑II算法对测试集数据进行集成预测;
S803、 对测试集的预测结果进行误差分析。
8.根据权利要求7所述的基于谱聚类的价格指数动态优化集成预测方法, 其特征在于,
步骤S803具体包括:
S8031、 计算滑动窗口下每个单体预测模型在不同时刻的预测误差, 利用下式计算每个
单体预测模型的预测误差平方和:
式中, i表示第i种单体 预测模型; λ表示窗口大小; Yt为金融时间序列第t期的实际数值;
为第i种单体预测模型在第t期的预测结果; eit为第i种单体预测模型在第t期的预测误
差; Ei为第i种单体预测模型在窗口下的预测误差平方和;
S8032、 对每个单体预测模型的预测误差平方和进行排序, 通过设置过滤系数以剔除误
差较大的模型;
S8033、 构建结合水平和方向精度的谱聚类模型。
9.根据权利要求8所述的基于谱聚类的价格指数动态优化集成预测方法, 其特征在于,
步骤S8033具体包括:
(1)利用下述水平 精度刻画函数选择最佳滑动窗口下的相对误差:
(2)方向性精度刻画函数为:
其中, ait表达为:
(3)权重系数之和等于1, 以下式表示:
(4)权重系数的取值范围在0和1之间, 以下式表示:
0≤wit≤1(i=1,2,…,m; t=1,2, …,n);
(5)谱聚类模型表示 为:
权 利 要 求 书 2/3 页
3
CN 115545803 A
3
专利 基于谱聚类的价格指数动态优化集成预测方法
文档预览
中文文档
21 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 12:13:14上传分享