iso file download
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210081205.1 (22)申请日 2022.01.24 (71)申请人 中国第一汽车股份有限公司 地址 130011 吉林省长 春市汽车 经济技术 开发区新红旗大街1号 (72)发明人 刘昕 郑红丽 刘朝阳 蔡旭  (74)专利代理 机构 北京翔宇专利代理事务所 (普通合伙) 11960 专利代理师 任宗华 (51)Int.Cl. G06F 9/445(2018.01) G06F 9/48(2006.01) G06F 9/50(2006.01) (54)发明名称 一种软件健康管理方法、 装置、 设备及存储 介质 (57)摘要 本发明公开了一种软件健康管理方法、 装 置、 设备及存储介质, 涉及软件健康管理技术领 域。 本发明包括如下步骤: 当检测到系统启动后, 启动生命周期管理模块; 根据预先设置的配置文 件使生命周期管理模块对各个进程逐一进行启 动; 检测到生命周 期管理模块启动后, 启动高可 用管理进程对; 本发明通过配置文件配置进程的 启动顺序、 依赖关系、 资源分配、 和重启策略, 通 过一个高度可复原的管理进程(镜像对)和健康 管理服务建立一套高可用的软件健康管理方法, 并且可通过配置文件的方式做到线程级监控并 且时间阈值可配置, 保证整个系统软件减少停工 时间, 保持其服务的高度可用性, 使得用户基本 感受不到软件故障, 提高用户体验。 权利要求书2页 说明书8页 附图3页 CN 114546517 A 2022.05.27 CN 114546517 A 1.一种软件健康管理方法, 其特 征在于, 所述方法包括: 当检测到系统启动 后, 启动生命周期管理模块; 根据预先设置的配置文件使生命周期管理模块对各个进程逐一进行启动; 检测到生命周期管理模块启动 后, 启动高可用管理进程对; 所述高可用管理进程对中的守护进程及镜像守护进程均处于启动状态, 同时守护进程 实时监控健康管理server进程; 当守护进程故障终止时, 镜像守护进程获取守护进程故障前正确的相同的状态, 并接 替守护进程成为 新的守护进程; 新的守护进程创建一个新的镜像守护进程, 且该新的镜像守护进程 也处于启动状态。 2.如权利要求1所述的一种软件健康管理方法, 其特征在于, 所述守护进程实时监控健 康管理server进程包括; 监控健康管理server进程是否异常; 当健康管理server进程出现异常时, 终止健康管理server进程; 当健康管理server进程被终止时, 生命周期管理模块重启健康管理server进程。 3.如权利 要求1所述的一种软件健康管理方法, 其特征在于, 健康管理server进程用于 监控其它线程包括: 被监控线程通过健康管理模块提供的client接口, 通过进程间通信方式完成与server 的连接, 并定周期向server端发送 心跳; Server端接收并更新各线程的心跳时间; Server端循环检测需要监控的线程心跳信息, 并对心跳异常线程的进程相应处 理; 问题线程所在进程被杀掉, 生命周期管理模块根据该进程的Crash恢复策略判断是否 重启进程。 4.如权利要求1所述的一种软件健康管理方法, 其特 征在于, 配置文件 还包括: 配置文件中配置了进程间的依赖关系, 如进程2依赖于进程1, 如果进程1因为某些情况 crash了, 生命周期管理模块会同样将进程2杀死, 然后再按照依赖关系依次启动进程1、 进 程2; 配置文件中还配置有需要监控的进程和线程的名单及时间阈值; 不同线程监控根据时间阈值的不同做不同的处理, 时间阈值可以设为2档, 根据被监控 线程心跳 丢失的时间阈值档位做不同处 理; 有Client请求连接健康管理Server进程, 如果Client在配置文件中的列表里, 服务器 端则添加Cl ient并开始监测其状态; 如果Client名不在配置文件中列表里, 则忽略该Cl ient的连接请求, 并记录错 误log。 5.如权利要求4所述的一种软件健康管理方法, 其特征在于, 时间阈值的2档位具体包 括: 当监控线程心跳丢失时间达到第一档位时, 仅记录log处理, 当丢失时间达到5秒即第 二档位时, 需要杀掉线程所在进程。 6.如权利要求1所述的一种软件健康管理方法, 其特征在于, 生命周期管理模块的重启 策略为: 通过配置文件配置进程1为自动重启策略, 当进程1因为某些情况crash了, 生命周期管权 利 要 求 书 1/2 页 2 CN 114546517 A 2理模块会重新启动进程1; 将系统中的服 务和应用进程设置为自动重启。 7.如权利要求4所述的一种软件健康管理方法, 其特征在于, 健康管理server进程被 Crash后的策略为: 健康管理server进程Crash之后, 生命周期管理模块会重新启动它; 健康管理server进程被Crash的时间段内, 因通信S erver节点不存在了, Client会发送 心跳失败; Client发送 心跳失败, 会重新连接服 务器, 且包括以下两种情况: 1).连接成功, 则再次发送 心跳; 2).连接失败, 会有retry连接 处理, retry成功, 则再次发送心跳, 超过retry 次数, 则记 录错误log, 不再连接和发送 心跳。 8.如权利要求5所述的一种软件健康管理方法, 其特征在于, 时间阈值的2档为时间档 位, 如第一档位的时间为2秒、 第二档位的时间为5秒, 当监控线程心跳丢失时间达到2秒, 仅 记录log处理, 当丢失时间达到5秒, 需要杀掉线程所在进程, 且第一档位始终小于第二档 位。 9.如权利要求1所述的一种软件健康管理方法, 其特 征在于, 高可用管理进程对 包括; 守护进程、 该守护进程的镜像守护进程, 守护进程负责监控健康管理server进程; 其中, 镜像守护进程用于当守护进程异常被终止时接替守护进程。 10.一种软件健康管理装置, 其特 征在于, 该装置包括; 软件系统健康管理模块, 软件系统健康管理模块包括生命周期管理模块、 健康管理模 块; 生命周期管理模块用于唤醒高可用管理进程对及重启被杀掉的异常进程或线程; 健康管理模块用于监控进程和进程中的线程。 11.一种软件健康管理设备, 其特 征在于, 该设备包括: 存储器, 存储至少一个指令; 处理器, 执行所述存储器中存储的指令以实现如权利要求1 ‑9中任意一项所述的一种 软件健康管理方法。 12.一种软件健康管理存储介质, 其特征在于, 该存储介质包括存储有至少一个指令, 所述至少一个指 令被软件健康管理设备中的处理器执行以实现如权利要求 1‑9中任意一项 所述的一种软件健康管理方法。权 利 要 求 书 2/2 页 3 CN 114546517 A 3

.PDF文档 专利 一种软件健康管理方法、装置、设备及存储介质

文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种软件健康管理方法、装置、设备及存储介质 第 1 页 专利 一种软件健康管理方法、装置、设备及存储介质 第 2 页 专利 一种软件健康管理方法、装置、设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 16:02:21上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。