iso file download
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210088857.8 (22)申请日 2022.01.25 (71)申请人 北京沃东天骏信息技 术有限公司 地址 100176 北京市大兴区北京经济技 术 开发区科创十一街18号院2号楼4层 A402室 申请人 北京京东世纪贸易有限公司 (72)发明人 邢召龙 刘近光 王文生 张克丰 包勇军 刘倩欣 张林 贺旭 熊俊 (74)专利代理 机构 北京律智知识产权代理有限 公司 11438 专利代理师 王辉 阚梓瑄 (51)Int.Cl. G06F 16/22(2019.01)G06F 16/23(2019.01) G06F 16/2455(2019.01) (54)发明名称 数据处理方法及装置、 计算机存储介质、 电 子设备 (57)摘要 本公开涉及计算机技术领域, 提供了一种数 据处理方法、 数据处理装置、 计算机存储介质、 电 子设备, 应用于数据分片终端, 所述数据分片终 端与多个参数服务器通信连接, 所述参数服务器 用于维护待存储数据, 其中, 数据处理方法包括: 按照预设分片数目将待存储数据划分为带有分 片序号的多个 分片; 根据所述预设分片数目和所 述参数服务器的数目, 确定分配至各所述参数服 务器的分片序号, 以使各所述参数服务器加载所 述分片序号对应的分片, 并为所述分片创建索 引。 本公开能够在参数服务器数目变更时, 避免 数据重分片操作, 提高数据的加载效率, 从而提 升模型训练和模型 上线的效率。 权利要求书2页 说明书11页 附图6页 CN 114443658 A 2022.05.06 CN 114443658 A 1.一种数据处理方法, 其特征在于, 应用于数据分片终端, 所述数据分片终端与多个参 数服务器通信连接, 所述 参数服务器用于维护待存 储数据, 所述方法包括: 按照预设 分片数目将待存 储数据划分为带有分片序号的多个分片; 根据所述预设分片数目和所述参数服务器的数目, 确定分配至各所述参数服务器的分 片序号, 以使各 所述参数服务器加载 所述分片序号对应的分片, 并为所述分片创建索引。 2.根据权利要求1所述的方法, 其特征在于, 所述待存储数据包括用于训练机器学习 模 型的多个模型参数; 所述按照预设 分片数目将待存 储数据划分为带有分片序号的多个分片, 包括: 利用预设的哈希算法确定各 所述模型参数对应的哈希值; 对各所述哈希值与 所述预设分片数目进行取余运算, 得到各所述模型参数所属的分片 序号; 将所述所属的分片序号相同的模型参数划分为一个分片, 以获得所述带有分片序号的 多个分片。 3.根据权利要求1所述的方法, 其特征在于, 所述根据所述预设分片数目和所述参数服 务器的数目, 确定分配至各 所述参数服务器的分片序号, 包括: 获取所述预设 分片数目除以所述 参数服务器的数目所 得的商值; 对所述商值进行向下 取整, 得到向各 所述参数服务器分配的分片个数; 根据所述分片个数, 确定分配至各 所述参数服务器的分片序号。 4.根据权利要求3所述的方法, 其特征在于, 所述根据所述分片个数, 确定分配至各所 述参数服务器的分片序号, 包括: 对于前n‑1个参数服务器, 根据所述分片序号由小到大的顺序, 依次向每个参数服务器 分配与所述分片个数相对应的分片; 将未分配的分片序号确定为分配至各第n个参数服 务器的分片序号; n表示所述 参数服务器的数目, n 为大于1的整数。 5.根据权利要求1所述的方法, 其特征在于, 当所述参数服务器的数目发生变更时, 所 述方法还 包括: 获取变更后的所述 参数服务器的目标 数目; 根据所述预设分片数目和所述目标数目, 确定分配至各所述参数服务器的目标分片序 号, 以使各 所述参数服务器加载 所述目标分片序号对应的分片, 并为所述分片创建索引。 6.一种数据处 理方法, 其特 征在于, 应用于参数服 务器, 所述方法包括: 获取分配至所述 参数服务器的分片序号, 以及, 分配至所述 参数服务器的分片个数; 获取所述参数服务器的标识与所述分片个数之间的乘积; 根据各所述分片序号和所述乘积的差值, 确定各 所述分片对应的索引。 7.一种数据处 理装置, 其特 征在于, 包括: 数据分片模块, 用于按照预设分片数目将待存储数据划分为带有分片序号的多个分 片; 分片加载模块, 用于根据所述预设分片数目和所述参数服务器的数目, 确定分配至各 所述参数服务器的分片序号, 以使各所述参数服务器加载所述分片序号对应的分片, 并为 所述分片创建索引。权 利 要 求 书 1/2 页 2 CN 114443658 A 28.一种数据处 理装置, 其特 征在于, 包括: 序号获取模块, 用于获取分配至所述参数服务器的分片个数, 以及, 分配至所述参数服 务器的分片序号; 乘积获取模块, 用于获取 所述参数服务器的标识与所述分片个数之间的乘积; 索引创建模块, 用于根据各所述分片序号和所述乘积的差值, 确定各所述分片对应的 索引。 9.一种计算机存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机程序被处理 器执行时实现权利要求1~6中任意 一项所述的数据处 理方法。 10.一种电子设备, 其特 征在于, 包括: 处理器; 以及 存储器, 用于存 储所述处 理器的可 执行指令; 其中, 所述处理器配置为经由执行所述可执行指令来执行权利要求1~6 中任意一项所 述的数据处 理方法。权 利 要 求 书 2/2 页 3 CN 114443658 A 3
专利 数据处理方法及装置、计算机存储介质、电子设备
文档预览
中文文档
20 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助3元下载(无需注册)
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助3元下载
本文档由 人生无常 于
2024-03-18 11:20:03
上传分享
举报
下载
原文档
(857.0 KB)
分享
友情链接
GM-T 0041-2015 智能IC卡密码检测规范.pdf
数据安全和个人信息保护社会责任指南2.1实施.pdf
T-XMYXH 0001—2023 厦门市医疗机构“规范药房”管理指南.pdf
GB-T 21219-2023 磁性材料 分类.pdf
GB-T 446-2023 全精炼石蜡.pdf
DB11-T 1968-2022 中央厨房布局设置与管理规范 北京市.pdf
WS-T 305-2009 卫生信息数据集元数据规范.pdf
T-ZJEI 008—2023 制造业企业 数字化技术改造指南.pdf
GB-T 32914-2023 信息安全技术 网络安全服务能力要求.pdf
GB-T 43553.1-2023 智能工厂数字化交付 第1部分:通用要求.pdf
思度安全-DSMM-016 合规管理规范V1.0.pdf
JR-T 0070-2012 信用增进机构风险管理规范.pdf
民航 MH-T 6038-2012 民用航空燃料水路运输质量控制.pdf
GB-T 33282-2016 室内用石材家具通用技术条件.pdf
GB-T 33356-2022 新型智慧城市评价指标.pdf
NY-T 3990-2021 数字果园建设规范 苹果.pdf
GB-T 13861-2022 生产过程危险和有害因素分类与代码.pdf
GB-T 4990-2010 热电偶用补偿导线合金丝.pdf
GM-T 0063-2018 智能密码钥匙密码应用接口检测规范.pdf
KSME2001_Adaptive compensation control of vehicle automatic transmissions for smooth shift transients based on intelligent supervisor.pdf
1
/
3
20
评价文档
赞助3元 点击下载(857.0 KB)
回到顶部
×
微信扫码支付
3
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。