iso file download
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210111581.0 (22)申请日 2022.01.29 (71)申请人 北京百度网讯科技有限公司 地址 100085 北京市海淀区上地十街10号 百度大厦2层 (72)发明人 王昊  (74)专利代理 机构 北京同立钧成知识产权代理 有限公司 1 1205 专利代理师 李哲 臧建明 (51)Int.Cl. G06V 10/764(2022.01) G06V 10/82(2022.01) G06V 10/40(2022.01) G06V 10/80(2022.01) G06K 9/62(2022.01)G06N 3/04(2006.01) (54)发明名称 图像处理、 模型训练方法、 装置、 设备、 存储 介质及程序 (57)摘要 本公开提供了图像处理、 模型训练方法、 装 置、 设备、 存储介质及程序, 涉及人工智能领域, 尤其涉及计算机视觉和深度学习技术领域。 具体 实现方案为: 获取待处理的第一图像, 对第一图 像进行特征提取, 得到第一图像特征, 根据M种特 征增强方式, 对所述第一图像特征进行M次特征 增强处理, 得到M个第二图像特征, 所述M为大于 或等于1的整数; 对所述M个第二图像特征进行分 类处理, 得到 所述第一图像的类别。 上述过程, 一 方面提高了图像 分类结果的准确性, 另一方面提 高了分类效率。 权利要求书6页 说明书16页 附图6页 CN 114463584 A 2022.05.10 CN 114463584 A 1.一种图像处 理方法, 包括: 获取待处 理的第一图像; 对所述第一图像进行 特征提取, 得到第一图像特 征; 根据M种特征增强方式, 对所述第一图像特征进行M次特征增强处理, 得到M个第二图像 特征, 所述M为大于或等于1的整数; 对所述M个第二图像特 征进行分类处 理, 得到所述第一图像的类别。 2.根据权利要求1所述的方法, 其中, 根据M种特征增强方式, 对所述第 一图像特征进行 M次特征增强处 理, 得到M个第二图像特 征, 包括: 根据每一特征增强方式, 在所述第 一图像特征中确定第 一子图像特征和第 二子图像特 征; 根据每一特 征增强方式, 对所述第一子图像特 征进行处 理, 得到目标增强参数; 根据所述目标增强参数对所述第 二子图像特征进行特征增强处理, 得到每一特征增强 方式对应的所述第二图像特 征。 3.根据权利要求2所述的方法, 其中, 根据每一特征增强方式, 对所述第一子 图像特征 进行处理, 得到目标增强参数, 包括: 在所述第一子图像特 征中确定第三子图像特 征和第四子图像特 征; 根据所述特征增强方式对应的位置编码参数, 对所述第 三子图像特征进行位置编码处 理, 得到位置矩阵; 对所述第三子图像特 征和所述第四子图像特 征进行预设运算, 得到权重系数矩阵; 根据所述 位置矩阵和所述权 重系数矩阵, 确定所述目标增强参数。 4.根据权利要求3所述的方法, 其中, 对所述第 三子图像特征和所述第四子图像特征进 行预设运算, 得到权重系数矩阵, 包括: 对所述第三子图像特 征和所述第四子图像特 征进行相乘处 理, 得到中间融合结果; 利用激活函数对所述中间融合结果进行处 理, 得到所述权 重系数矩阵。 5.根据权利要 求2至4任一项所述的方法, 其中, 所述第一图像特征包括K1个通道对应的 通道特征; 根据每一特征增强方式, 在所述第一图像特征中确定第一子图像特征和第二子 图像特征, 包括: 根据所述特征增强方式对应的卷积参数对所述第 一图像特征进行卷积处理, 得到第 三 图像特征, 所述第三图像特 征中包括K2个通道对应的通道特 征, K2<K1; 对所述第三图像特征进行通道分解处理, 得到所述第 一子图像特征和所述第 二子图像 特征。 6.根据权利要求2至5任一项所述的方法, 其中, 根据所述目标增强参数对所述第二子 图像特征进行特征增强处 理, 得到每一特 征增强方式对应的所述第二图像特 征, 包括: 对所述目标增强参数和所述第二子图像特 征进行相乘处 理, 得到增强图像特 征; 对所述增强图像特 征进行卷积处理和池化处 理, 得到所述第二图像特 征。 7.根据权利要求1至6任一项所述的方法, 其中, 对所述第 一图像进行特征提取, 得到第 一图像特 征, 包括: 对所述第一图像进行 卷积处理, 得到第1卷积图像, 所述第1卷积图像中包括 N1个通道; 对第i卷积图像进行通道扩充处理, 得到第i+1卷积图像; 所述i依次取1、 2、 …、 N, 所述权 利 要 求 书 1/6 页 2 CN 114463584 A 2第i+1卷积图像包括 Ni+1个通道, Ni+1>Ni; 根据所述第N+1卷积图像确定所述第一图像特 征。 8.根据权利要求1至7任一项所述的方法, 其中, 对所述M个第二图像特征进行分类处 理, 得到所述第一图像的类别, 包括: 对所述M个第二图像特 征进行融合处 理, 得到融合图像特 征; 对所述融合图像特 征进行分类处 理, 得到所述第一图像为预设类别的概 率; 若所述概率大于或者 等于预设阈值, 则确定所述第一图像的类别为所述预设类别; 若所述概率小于预设概 率, 则确定所述第一图像的类别为非预设类别。 9.根据权利要求1至8任一项所述的方法, 其中, 对所述第一图像进行 特征提取, 得到第一图像特 征, 包括: 通过预设模型对所述第一图像进行 特征提取, 得到第一图像特 征; 根据M种特征增强方式, 对所述第一图像特征进行M次特征增强处理, 得到M个第二图像 特征, 包括: 通过所述预设模型根据M种特征增强方式, 对所述第一图像特征进行M次特征增强处 理, 得到M个第二图像特 征; 对所述M个第二图像特 征进行分类处 理, 得到所述第一图像的类别, 包括: 通过所述预设模型对所述M个第二图像特 征进行分类处 理, 得到所述第一图像的类别。 10.根据权利要求1至9任一项所述的方法, 对所述M个第二图像特征进行分类处理, 得 到所述第一图像的类别之后, 还 包括: 显示所述第一图像的类别; 或者, 向预设设备发送所述第一图像的类别。 11.一种模型训练方法, 包括: 获取第一样本图像和所述第一样本图像对应的标记类别; 通过预设模型对所述第一样本图像进行 特征提取, 得到第一图像特 征; 通过所述预设模型根据M种特征增强方式, 对所述第一图像特征进行M次特征增强处 理, 得到M个第二图像特 征, 所述M为大于或等于1的整数; 通过所述预设模型对所述M个第二图像特征进行分类处理, 得到所述第一样本 图像的 预测类别; 根据所述标记类别和所述预测类别, 更新所述预设模型的模型参数。 12.根据权利要求11所述的方法, 其中, 根据M种特征增强方式, 对所述第 一图像特征进 行M次特征增强处 理, 得到M个第二图像特 征, 包括: 根据每一特征增强方式, 在所述第 一图像特征中确定第 一子图像特征和第 二子图像特 征; 根据每一特 征增强方式, 对所述第一子图像特 征进行处 理, 得到目标增强参数; 根据所述目标增强参数对所述第 二子图像特征进行特征增强处理, 得到每一特征增强 方式对应的所述第二图像特 征。 13.根据权利要求12所述的方法, 其中, 根据每一特征增强方式, 对所述第一子 图像特 征进行处 理, 得到目标增强参数, 包括: 在所述第一子图像特 征中确定第三子图像特 征和第四子图像特 征;权 利 要 求 书 2/6 页 3 CN 114463584 A 3

.PDF文档 专利 图像处理、模型训练方法、装置、设备、存储介质及程序

文档预览
中文文档 29 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共29页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 图像处理、模型训练方法、装置、设备、存储介质及程序 第 1 页 专利 图像处理、模型训练方法、装置、设备、存储介质及程序 第 2 页 专利 图像处理、模型训练方法、装置、设备、存储介质及程序 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 01:20:21上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。