iso file download
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210096168.1 (22)申请日 2022.01.26 (71)申请人 阿里云计算有限公司 地址 310012 浙江省杭州市西湖区转塘科 技经济区块12号 (72)发明人 陈壮豪  (74)专利代理 机构 北京太合九思知识产权代理 有限公司 1 1610 专利代理师 张爱 刘戈 (51)Int.Cl. G06F 9/48(2006.01) G06F 9/54(2006.01) G06F 9/50(2006.01) G06F 9/455(2006.01) G06F 16/23(2019.01)G06F 16/27(2019.01) (54)发明名称 数据处理方法、 设备及存 储介质 (57)摘要 本申请实施例提供一种数据处理方法、 设备 及存储介质。 在数据处理方法中, 已创建的目标 作业实例可动态加载一个或者多个数据处理模 型的元数据, 并根据动态加载到的元数据运行新 增的一个或者多个数据处理模型。 在运行新增的 数据处理模 型后, 可根据该新增的数据处理模型 的计算规则, 对当前监听的数据源中的数据进行 处理。 在这种实施方式中, 一方面, 作业实例可动 态加载数据处理模型, 无需在提交作业时对数据 处理模型进行定制化开发, 降低了开发成本; 另 一方面, 一个作业实例可支持一个或者多个数据 处理模型的运行操作, 实现了资源的共享, 极大 提升了资源的利用率。 权利要求书2页 说明书11页 附图2页 CN 114489985 A 2022.05.13 CN 114489985 A 1.一种数据处 理方法, 其特 征在于, 包括: 响应模型加载事件, 通过目标作业实例, 从目标存储空间加载至少一个数据处理模型 的元数据; 通过所述目标作业实例, 分别根据所述至少一个数据处理模型的元数据, 运行所述至 少一个数据处 理模型; 通过所述目标作业实例, 根据所述至少一个数据处理模型各自的计算规则, 对当前监 听的第一数据源中的数据分别进行处 理。 2.根据权利要求1所述的方法, 其特征在于, 通过目标作业实例, 从指定存储空间加载 至少一个数据处 理模型的模型 元数据之前, 还 包括: 接收模型提交请求; 所述模型提交请求携带新增的数据处理模型的模型元数据以及所 述目标作业实例的实例标识; 将所述新增的数据处理模型的模型元数据, 存储在所述实例标识对应的所述目标存储 空间中。 3.根据权利要求1所述的方法, 其特征在于, 根据 所述至少一个数据处理模型各自的计 算规则, 对当前监听的第一数据源中的数据分别进行处 理之前, 还 包括: 针对所述至少一个数据处理模型中的任一数据处理模型, 确定所述数据处理模型对应 的第二数据源; 将所述第二数据源中的数据以及所述数据的处理进度信 息, 实时同步至所述第 一数据 源中, 以供 所述目标作业实例读取。 4.根据权利要求3所述的方法, 其特征在于, 通过所述目标作业实例, 分别根据所述至 少一个数据处 理模型的元 数据, 运行 所述至少一个数据处 理模型, 包括: 根据所述数据处 理模型的元 数据, 确定所述数据处 理模型包 含的多个 计算单元; 识别所述多个 计算单元各自的计算类型; 根据所述多个计算单元各自的计算类型, 将所述数据处理模型的运行过程划分为至少 一个运行阶段; 采用所述目标作业实例对应的不同资源, 分别运行所述至少一个运行阶段各自包含的 计算单元。 5.根据权利要求4所述的方法, 其特征在于, 识别所述多个计算单元各自的计算类型, 包括: 针对所述多个计算单元中的任一计算单元, 从所述数据处理模型的元数据中获取所述 计算单元的执行脚本; 解析所述执行脚本, 并根据解析 结果判断所述计算单 元是否包含状态读写操作; 若所述计算单 元包含状态读写操作, 则确定所述计算单 元的计算类型为有状态计算。 6.根据权利要求4所述的方法, 其特征在于, 所述目标作业实例部署在分布式计算系统 中, 所述分布式计算系统包含: 用于执行无状态计算的第一类计算节点, 以及用于执行有状 态计算的第二类 计算节点; 采用所述目标作业实例对应的不同的资源, 分别运行所述至少一个运行阶段各自包含 的计算单 元, 包括: 通过所述目标作业实例, 采用所述第 一类计算节点中的第 一目标节点运行无状态计算权 利 要 求 书 1/2 页 2 CN 114489985 A 2阶段的计算单元, 和/或, 采用所述第二类计算节点中的第二目标节点运行有状态计算阶段 的计算单 元。 7.根据权利要求6所述的方法, 其特征在于, 通过所述目标作业实例, 根据所述至少一 个数据处 理模型各自的计算 规则, 对当前监听的第一数据源中的数据分别进行处 理, 包括: 通过所述第一目标节点上运行的计算单元, 根据接收到的数据进行无状态计算, 得到 无状态计算结果; 若所述数据处理模型不包含有状态计算规则, 则通过所述第 一目标节点输出所述无状 态计算结果。 8.根据权利要求7 所述的方法, 其特 征在于, 还 包括: 若所述数据处理模型包含有状态计算规则, 则通过所述第一目标节点, 根据所述数据 处理模型的标识, 将所述无状态计算结果发送至所述第二目标节点; 通过所述第 二目标节点上运行的计算单元, 根据接收到的所述无状态计算结果进行有 状态计算, 得到有状态计算结果, 并输出 所述有状态计算结果。 9.一种服 务器, 其特 征在于, 包括: 存 储器和处 理器; 所述存储器用于存 储一条或多条计算机指令; 所述处理器用于执行所述一条或多条计算机指令以用于: 执行权利要求1 ‑8任一项所 述的方法中的步骤。 10.一种存储有计算机程序的计算机可读存储介质, 其特征在于, 计算机程序被处理器 执行时能够实现权利要求1 ‑8任一项所述的方法中的步骤。权 利 要 求 书 2/2 页 3 CN 114489985 A 3

.PDF文档 专利 数据处理方法、设备及存储介质

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 数据处理方法、设备及存储介质 第 1 页 专利 数据处理方法、设备及存储介质 第 2 页 专利 数据处理方法、设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 11:20:02上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。