iso file download
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211164211.X (22)申请日 2022.09.23 (71)申请人 深圳前海环融联易信息科技 服务有 限公司 地址 518000 广东省深圳市前海深港合作 区前湾一路1号A栋201室(入驻深圳市 前海商务秘书 有限公司) (72)发明人 陈永红 谢翀 兰鹏 罗伟杰  陈柯树 赵豫陕  (74)专利代理 机构 深圳众鼎汇成知识产权代理 有限公司 4 4566 专利代理师 朱业刚 (51)Int.Cl. G06K 9/62(2022.01) G06N 20/00(2019.01) (54)发明名称 持续学习的模型更新方法、 装置、 设备及介 质 (57)摘要 本申请涉及一种持续学习的模 型更新方法、 装置、 设备及介质。 该方法获取待更新模型的历 史模型, 提取历史提取器参数和历史分类器参 数, 使用历史提取器参数初始化待更新模型, 将 更新样本输入历史模型和初始化后的待更新模 型, 输出第一预测标签和第二预测标签, 使用更 新样本的真实标签、 第一预测标签和第二预测标 签, 构建特征学习损失、 分类学习损失和样本特 征损失, 以此计算待更新模型的训练总损失, 根 据训练总损失更新初始化后的待更新模型, 重复 计算直至训练总损失收敛, 得到更新好的待更新 模型, 实现在无需历史样本的情况下, 仅使用历 史模型进行更新, 既无需维护历史样本, 又可 以 基于历史模 型快速地进行模型更新, 提高了模型 的更新响应效率。 权利要求书2页 说明书13页 附图3页 CN 115238838 A 2022.10.25 CN 115238838 A 1.一种持续学习的模型 更新方法, 其特 征在于, 所述模型 更新方法包括: 获取待更新模型的历史模型, 提取所述历史模型中特征提取器的历史提取器参数, 使 用所述历史提取器参数, 对所述待更新模型 的特征提取器进行初始化, 得到初始化后的待 更新模型, 将所述初始化后的待更新模型作为当前模型; 将更新样本中每个样本分别输入所述历史模型, 输出对应样本的第一预测标签, 将所 述每个样本分别输入所述当前模型, 输出对应样本的第二预测标签, 根据所述第一预测标 签和所述第二预测标签, 构建特 征学习损失和分类学习损失; 使用所述更新样本的真实标签和所述第二预测标签, 构建样本特征损 失, 根据所述特 征学习损失、 所述分类学习损失和所述样本特 征损失, 计算所述当前模型的训练总损失; 根据所述训练总损失, 更新所述当前模型, 得到更新后的当前模型, 返回执行将更新样 本中每个样本分别输入所述历史模型, 输出对应样本的第一预测标签, 将所述每个样本分 别输入所述当前模型, 输出对应样本的第二预测标签的步骤, 直至所述训练总损失收敛, 确 定所述训练总损失收敛时使用的模型为更新 好的待更新模型。 2.根据权利要求1所述的模型更新方法, 其特征在于, 所述根据 所述第一预测标签和所 述第二预测标签, 构建特 征学习损失和分类学习损失包括: 获取所述历史模型中分类 器的分类目标类别; 针对任一样本, 若对应所述样本的第一预测标签属于所述分类目标类别, 则使用对应 所述样本的第一预测标签和对应所述样本的第二预测标签, 构建特征学习损失和分类学习 损失。 3.根据权利要求2所述的模型更新方法, 其特征在于, 所述使用对应所述样本的第 一预 测标签和对应所述样本的第二预测标签, 构建特 征学习损失和分类学习损失包括: 计算对应所述样本的第 一预测标签和对应所述样本的第 二预测标签之间的相对熵, 确 定计算结果 为对应所述样本的特 征学习损失; 计算对应所述样本的第 一预测标签和对应所述样本的第 二预测标签之间的交叉熵, 确 定计算结果 为对应所述样本的分类学习损失。 4.根据权利要求2所述的模型更新方法, 其特征在于, 所述使用所述更新样本的真实标 签和所述第二预测标签, 构建样本特 征损失包括: 针对任一样本, 若所述样本对应的第一预测标签不属于所述分类目标类别, 则使用所 述样本的真实标签和对应所述样本的第二预测标签, 构建样本特 征损失。 5.根据权利要求4所述的模型更新方法, 其特征在于, 所述使用所述样本的真实标签和 对应所述样本的第二预测标签, 构建样本特 征损失包括: 计算所述样本的真是标签和对应所述样本的第 二预测标签之间的交叉熵, 确定计算结 果为对应所述样本的样本特 征损失。 6.根据权利要求1至5任一项所述的模型更新方法, 其特征在于, 所述根据所述特征学 习损失、 所述分类学习损失和所述样本特 征损失, 计算所述待更新模型的训练总损失包括: 获取第一权重值、 第二权重值和第三权重值, 其中, 所述第一权重值、 所述第二权重值 和所述第三权 重值的和为1; 将所述特 征学习损失与所述第一权 重值相乘, 得到第一乘积; 将所述分类学习损失与所述第二权 重值相乘, 得到第二乘积;权 利 要 求 书 1/2 页 2 CN 115238838 A 2将所述样本特 征损失与所述第三权 重值相乘, 得到第三乘积; 将所述第一乘积、 所述第二乘积和所述第三乘积相加, 确定相加结果为所述待更新模 型的训练总损失。 7.根据权利要求6所述的模型更新方法, 其特征在于, 在所述获取第一权重值、 第二权 重值和第三权 重值之前, 还 包括: 获取用户对训练所述历史模型的历史样本的偏好程度, 以及对所述更新样本偏好程 度; 根据所述历史样本的偏好程度和所述更新样本的偏好程度, 生成第一权重值、 第二权 重值和第三权重值, 其中, 若 所述历史样本的偏好程度高于所述更新样本的偏好程度, 则所 述第一权 重值大于所述第二权 重值和所述第三权 重值的和。 8.一种持续学习的模型 更新装置, 其特 征在于, 所述模型 更新装置包括: 初始化模块, 用于获取待更新模型的历史模型, 提取所述历史模型中特征提取器的历 史提取器参数, 使用所述历史提取器参数, 对所述待 更新模型的特征提取器进 行初始化, 得 到初始化后的待更新模型, 将所述初始化后的待更新模型作为当前模型; 标签预测模块, 用于将更新样本中每个样本分别输入所述历史模型, 输出对应样本的 第一预测标签, 将所述每个样本 分别输入所述当前模型, 输出对应样本的第二预测标签, 根 据所述第一预测标签和所述第二预测标签, 构建特 征学习损失和分类学习损失; 损失计算模块, 用于使用所述更新样本的真实标签和所述第二预测标签, 构建样本特 征损失, 根据所述特征学习损失、 所述分类学习损失和所述样本特征损失, 计算所述待更新 模型的训练总损失; 模型更新模块, 用于根据所述训练总损失, 更新所述当前模型, 得到更新后的当前模 型, 将所述更新后的当前模型发送至所述标签预测模块, 以供所述标签更新模块将更新样 本中每个样本分别输入所述历史模型, 输出对应样本的第一预测标签, 将所述每个样本分 别输入所述当前模型, 输出对应样本的第二预测标签, 直至所述训练总损失收敛; 所述模型更新模块还用于确定所述训练总损失收敛时使用的模型为更新好的待更新 模型。 9.一种计算机设备, 其特征在于, 所述计算机设备包括处理器、 存储器以及存储在所述 存储器中并可在所述处理器上运行的计算机程序, 所述处理器执行所述计算机程序时实现 如权利要求1至7任一项所述的模型 更新方法。 10.一种计算机可读存储介质, 所述计算机可读存储介质存储有计算机程序, 其特征在 于, 所述计算机程序被处 理器执行时实现如权利要求1至7任一项所述的模型 更新方法。权 利 要 求 书 2/2 页 3 CN 115238838 A 3

.PDF文档 专利 持续学习的模型更新方法、装置、设备及介质

文档预览
中文文档 19 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 持续学习的模型更新方法、装置、设备及介质 第 1 页 专利 持续学习的模型更新方法、装置、设备及介质 第 2 页 专利 持续学习的模型更新方法、装置、设备及介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 12:13:31上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。