iso file download
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210108351.9 (22)申请日 2022.01.28 (71)申请人 北京百度网讯科技有限公司 地址 100085 北京市海淀区上地十街10号 百度大厦二层 (72)发明人 吴亮 刘珊珊 乔美娜 吕鹏原  章成全 姚锟  (74)专利代理 机构 北京清亦华知识产权代理事 务所(普通 合伙) 11201 专利代理师 杜月 (51)Int.Cl. G06V 30/148(2022.01) G06V 10/80(2022.01) G06V 10/778(2022.01) G06V 10/82(2022.01)G06V 30/19(2022.01) (54)发明名称 图像处理方法、 生成器训练方法、 装置及存 储介质 (57)摘要 本申请公开了一种图像处理方法、 生 成器训 练方法、 装置及存储介质, 可应用于光学字符识 别OCR等场景, 涉及人工智能技术领域, 具体地, 涉及深度学习、 计算机视觉技术领域。 具体实现 方案为: 获取具有标记的图像; 对具有标记的图 像进行多次下采样操作, 获得多个第一特征图; 对多个第一特征图分别进行卷积操作, 获得多个 第一特征图各自的中间特征图; 根据多个第一特 征图及其各自的中间特征图进行图像重建处理, 获得去标记图像。 本申请可以使得生成的去 标记 图像能够保留更多除标记以外的信息, 进而提高 了对图像中标记进行去除的准确度, 提高图像的 去标记效果, 从而提升对图像中信息识别的效 果。 权利要求书5页 说明书20页 附图11页 CN 114495110 A 2022.05.13 CN 114495110 A 1.一种图像处 理方法, 包括: 获取具有标记的图像; 对所述具有标记的图像进行多次下采样 操作, 获得多个第一特 征图; 对所述多个第 一特征图分别进行卷积操作, 获得所述多个第 一特征图各自的中间特征 图; 根据多个第一特 征图及其各自的中间特 征图进行图像重建处 理, 获得去标记的图像。 2.根据权利要求1所述的方法, 其中, 所述根据多个第 一特征图及其各自的中间特征图 进行图像重建处 理, 获得去标记图像, 包括: 对所述多个第 一特征图中尺寸最小的第 一特征图进行一 次上采样操作, 得到第 二特征 图; 将所述第二特征图与 所述多个第 一特征图之中相同大小的第 一特征图进行拼接处理, 获得第一融合特 征图; 对所述第一融合特 征图进行 上采样操作, 得到新的第二特 征图; 基于新的第 二特征图的尺寸与所述具有标记的图像的尺寸相同, 将与 所述具有标记的 图像的尺寸相同的新的第二特 征图, 确定为去标记图像。 3.根据权利要求1所述的方法, 其中, 所述对所述多个第一特征图分别进行卷积操作, 获得所述多个第一特 征图各自的中间特 征图, 包括: 对所述多个第 一特征图的通道数分别进行缩小, 得到所述多个第 一特征图各自的第 一 中间特征图; 对所述多个第 一中间特征图分别进行卷积操作, 得到所述多个第 一中间特征图各自的 第二中间特 征图; 对所述多个第 二中间特征图的通道数分别进行扩大, 获得所述多个第 一特征图各自的 中间特征图。 4.根据权利要求1所述的方法, 其中, 所述对所述具有标记的图像进行多次下采样操 作, 获得多个第一特 征图, 包括: 将所述具有标记 的图像输入至预先训练的生成器; 所述生成器包括下采样层、 上采样 层和上采样融合模块; 获得所述下采样层对所述具有标记的图像进行多次下采样操作后输出的多个第一特 征图; 其中, 所述对所述多个第一特征图分别进行卷积操作, 获得所述多个第一特征图各自 的中间特 征图, 包括: 获得所述上采样融合模块对所述多个第一特征图的通道数分别进行缩小后输出的所 述多个第一特 征图各自的第一中间特 征图; 获得所述上采样融合模块对所述多个第一中间特征图分别进行卷积操作后输出的所 述多个第一中间特 征图各自的第二中间特 征图; 获得所述上采样融合模块对所述多个第二特征图的通道数分别进行扩大后输出的所 述多个第二中间特 征图各自的中间特 征图。 5.根据权利要求4所述的方法, 其中, 所述根据多个第 一特征图及其各自的中间特征图 进行图像重建处 理, 获得去标记图像, 包括:权 利 要 求 书 1/5 页 2 CN 114495110 A 2获得所述上采样层对所述多个第一特征图中尺寸最小的第一特征图进行一次上采样 操作后输出的第二特 征图; 获得所述上采样融合模块将所述第二特征图与所述多个第一特征图之中相同大小的 第一特征图进行拼接处 理后输出的第一融合特 征图; 获得所述上采样层对所述第 一融合特征图进行上采样操作后输出的新的第 二特征图; 基于新的第二特 征图的尺寸与所述具有标记的图像的尺寸相同, 将与所述具有标记的图像的尺寸相同的新的第二特 征图, 确定为去标记图像。 6.一种生成器训练方法, 所述训练方法包括: 获取具有标记的样本图像及获取真实图像; 所述真实图像为未具有标记的的所述样本 图像; 将所述具有标记的样本图像输入所述 生成器; 获取所述生成器对所述具有标记的样本图像进行多次下采样操作, 得到的多个第 一样 本特征图; 获取所述生成器对所述多个第 一样本特征图分别进行卷积操作, 得到的所述多个第 一 样本特征图各自的中间样本特 征图; 获取所述生成器根据多个第一样本特征图及其各自的中间样本特征图进行图像重建 处理, 获得的去标记样本图像; 将所述真实图像与所述具有标记的样本图像在通道上进行拼接, 得到真图; 将所述去标记样本图像与所述具有标记的样本图像在通道上进行拼接, 得到伪图; 将所述真图和所述伪图分别 输入至判别器, 获得所述真图的第 一判别结果和所述伪图 的第二判别结果; 根据所述第 一判别结果和第 二判别结果计算第 一损失值, 并根据 所述第一损失值训练 判别器; 根据所述去标记样本 图像、 所述真实图像和训练的所述判别器计算第二损 失值, 基于 所述第二损失值训练所述 生成器。 7.根据权利要求6所述的方法, 其中, 所述根据所述去标记样本 图像、 所述真实图像和 训练的所述判别器 计算第二损失值, 包括: 根据所述真实图像和所述去标记样本图像 计算第三损失值; 对所述真实图像进行文字分割处理得到第 一文字分割特征图, 并对所述去标记样本图 像进行文字分割处理得到第二文字 分割特征图, 根据所述第一文字 分割特征图和 第二文字 分割特征图计算第四损失值; 将所述去标记样本图像输入至训练 的所述判别器以得到判别结果, 并根据所述判别结 果计算第五损失值; 根据所述第三损失值、 所述第四损失值和所述第五损失值, 生成所述第二损失值。 8.根据权利要求7所述的方法, 其中, 所述对所述真实图像进行文字分割处理得到第 一 文字分割 特征图, 并对所述去标记样本图像进行文字分割处理得到第二文字分割 特征图, 包括: 将所述去标记样本图像输入预先训练 的文字分割 模型, 对所述去标记样本图像进行文 字分割, 得到第一文字分割特 征图;权 利 要 求 书 2/5 页 3 CN 114495110 A 3

.PDF文档 专利 图像处理方法、生成器训练方法、装置及存储介质

文档预览
中文文档 37 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共37页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 图像处理方法、生成器训练方法、装置及存储介质 第 1 页 专利 图像处理方法、生成器训练方法、装置及存储介质 第 2 页 专利 图像处理方法、生成器训练方法、装置及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 01:20:22上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。