(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211184190.8
(22)申请日 2022.09.27
(71)申请人 哈尔滨工业大 学
地址 150001 黑龙江省哈尔滨市南岗区西
大直街92号
(72)发明人 刘明 骆天依 曹喜滨 陈雪芹
(74)专利代理 机构 哈尔滨华夏松花江知识产权
代理有限公司 23213
专利代理师 张利明
(51)Int.Cl.
G06F 16/215(2019.01)
G06K 9/62(2022.01)
G06N 5/00(2006.01)
G06N 20/00(2019.01)
G06F 17/18(2006.01)
(54)发明名称
基于随机森林网络的卫星电源系统缺失数
据补全方法
(57)摘要
基于随机森林网络的卫星电源系统缺失数
据补全方法, 属于航天器遥测数据处理技术领
域, 本发明为解决现有卫星在轨数据补全技术存
在的问题。 本发明方法包括以下步骤: S1、 采集卫
星电源系统的遥测数据并进行预处理; S2、 预处
理后全部遥测数据按日期保存为多个.csv文件,
各.csv文件数据维度为L ×M; S3、 利用PCA算法从
全部.csv文件中筛选出待补全遥测数据相关特
征列N; S4、 将步骤S3筛选 出来的待补全遥测数据
相关特征列N输入至训练好的神经随机森林NRF
模型中, 获取缺失段数据; S5、 将神经随机森林
NRF模型输 出的缺失段数据与原始数据拼接在一
起, 获取完整遥测时序数据, 完成缺失数据补全。
权利要求书3页 说明书9页 附图2页
CN 115454988 A
2022.12.09
CN 115454988 A
1.基于随机森林网络的卫星电源系统缺失数据补全方法, 其特征在于, 该方法包括以
下步骤:
S1、 采集卫星电源系统 的遥测数据并进行预处理, 所述遥测数据由m类传感器采集并构
建为M维时序数据M={m1,m2,...,mm};
S2、 预处理后全部遥测数据按日期 保存为多个.csv文件, 各.csv文件数据维度 为L×M,
其中L={l1,l2,...,ln}代表记录时序数据的时间长度, M={m1,m2,...,mm}代表遥测参数 维
度;
S3、 利用PCA算法从全部.csv文件中筛选出待补全遥测数据相关特征列N={m1,m2,...,
mn}, N≤M;
S4、 将步骤S3筛选出来的待补全遥测数据相关特征列N输入至训练好的神经随机森林
NRF模型中, 获取缺失段 数据;
神经随机森林NRF模型的构建过程:
S41、 将一颗回归树 转化为树型神经网络;
S42、 构造神经网络各层的激活函数;
S43、 采用Bagging集成学习方式将多个S41构建的树型神经网络组合成神经随机森林
模型NRF;
S44、 采用贝叶斯优化 参数搜索对神经随机森林模型NRF进行模型调参;
S5、 将神经随机森林NRF模型输出的缺失段数据与原始数据拼接在一起, 获取完整遥测
时序数据, 完成缺失数据补全。
2.根据权利要求1所述基于随机森林网络的卫星电源系统缺失数据补全方法, 其特征
在于, S41将一颗回归树 转化为树型神经网络的过程包括:
步骤(1)、 构建一颗回归树, 并用三层神经网络表示, 分别为输入层、 隐藏层和输出层,
隐藏层包括第一隐藏层和第二隐藏层;
步骤(2)、 在第一隐藏层进行超平面空间划分;
步骤(3)、 在第二隐藏层进行叶节点 位置的定位;
步骤(4)、 在输出层进行加权求和, 完成一颗回归树 转化为树型神经网络的过程。
3.根据权利要求1或2所述基于随机森林网络的卫星电源系统缺失数据补全方法, 其特
征在于, S42构造神经网络各层的激活函数的过程包括:
步骤(5)、 采用改进的双曲正切激活函数k ‑tanh( τu)作为激活函数, 激活函数k ‑tanh( τ
u)为:
k为终端节点, γ为激活系数, 在输入层和第 一隐藏层之间
采用
激活; 在第
一隐藏层和第二隐藏层之间γ = k, 采用tanh(ku)激活, u为第一隐藏层或第二隐藏层输入。
4.根据权利要求3所述基于随机森林网络的卫星电源系统缺失数据补全方法, 其特征
在于, S43构建神经随机森林模型NRF的过程包括:权 利 要 求 书 1/3 页
2
CN 115454988 A
2步骤(6)、 采用Bagging集成学习方式, 将多个树型神经网络的预测结果进行加权平均,
表示为:
其中, x表示待处理数据, M表示树型神经网络的个数, αm代表第m个学习器的权重, 有
表示第m个树型神经网络的预测结果,
表示不同树型神经网络的差异。
5.根据权利要求4所述基于随机森林网络的卫星电源系统缺失数据补全方法, 其特征
在于, S44神经随机森林模型NRF的模型调参过程包括:
步骤(7)、 采用贝叶斯优化 参数搜索对神经随机森林模型NRF进行模型调参, 具体为
首先构造一个黑盒目标函数, 作为评判模型效果的标准, 选取回归问题的常用评价指
标R2; 接下来给定各个需要调试的超参数的上界和下界, 确定各自的搜索范围; 最后实例化
贝叶斯优化对象并确定迭代次数。
6.根据权利要求2所述基于随机森林网络的卫星电源系统缺失数据补全方法, 其特征
在于, 步骤(1)构建一颗回归树的过程 为:
定义分类回归树是组成NRF的基本元素, 数据特征维度集合X={x(1),x(2),...,x(d)}对
应数据值Y={y(1),y(2),...,y(d)}, 选取最小方差判据作为判断最优切分变量x(i)以及切分
点s的标准:
其中D={X,Y}=D1∪D2, D1(i,s)={x|x(i)≤s}和D2(i,s)={x|x(i)>s}分别为切分点划
分出的左右两部分训练集, c1=average(y(i)|x(i)∈D1)和c2=average(y(i)|x(i)∈D2)分别
为D1和D2两部分训练数据的均值, j为切分点 位置;
通过递归不断选择并保留当前最优切分变量xj以及切分点s, 直到回归树恰好包含k个
终端节点时停止, 能够生成一棵回归树T;
对于划分回归树T的超平面集合H={ H1,H2,...,HK‑1}中的任意一个超平面Hk∈H, k=1,
2,…,K‑1, 存在Hk={x:hk(x)=0}, 其中超平面方程
进行回归树分析的维
度ik=1,2,...,d, 偏置
为网络输入。
7.根据权利要求6所述基于随机森林网络的卫星电源系统缺失数据补全方法, 其特征
在于, 步骤(2)在第一隐藏层进行超平面空间划分的过程 为:
网络输入
与第一隐藏层 各个神经元一一对应连接, 第一隐藏层的神经元对应的K ‑1
个感知器 被用来判断划分特 征空间的超平面属性, 它 们的激活函数 可以统一定义 为:
其中threshold(x)= ±1为阈值型激活函数, 且连接权值为1, 偏置为
如果激活值
大于零, 那么神经 元就会被激活; 否则, 该神经 元处于抑制状态;
定义上式结果为+1时代表待查询叶子节点在超平面Hk的左侧, 结果为 ‑1时代表待查询
叶子节点在超平面Hk的右侧;权 利 要 求 书 2/3 页
3
CN 115454988 A
3
专利 基于随机森林网络的卫星电源系统缺失数据补全方法
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 12:13:17上传分享