专利 图像处理方法、生成器训练方法、装置及存储介质

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210108351.9 (22)申请日 2022.01.28 (71)申请人北京百度网讯科技有限公司地址 100085 北京市海淀区上地十街10号百度大厦二层 (72)发明人吴亮　刘珊珊　乔美娜　吕鹏原　章成全　姚锟　 (74)专利代理机构北京清亦华知识产权代理事务所(普通合伙) 11201 专利代理师杜月 (51)Int.Cl. G06V 30/148(2022.01) G06V 10/80(2022.01) G06V 10/778(2022.01) G06V 10/82(2022.01)G06V 30/19(2022.01) (54)发明名称图像处理方法、生成器训练方法、装置及存储介质 (57)摘要本申请公开了一种图像处理方法、生成器训练方法、装置及存储介质，可应用于光学字符识别OCR等场景，涉及人工智能技术领域，具体地，涉及深度学习、计算机视觉技术领域。具体实现方案为：获取具有标记的图像；对具有标记的图像进行多次下采样操作，获得多个第一特征图；对多个第一特征图分别进行卷积操作，获得多个第一特征图各自的中间特征图；根据多个第一特征图及其各自的中间特征图进行图像重建处理，获得去标记图像。本申请可以使得生成的去标记图像能够保留更多除标记以外的信息，进而提高了对图像中标记进行去除的准确度，提高图像的去标记效果，从而提升对图像中信息识别的效果。权利要求书5页说明书20页附图11页 CN 114495110 A 2022.05.13 CN 114495110 A 1.一种图像处理方法，包括：获取具有标记的图像；对所述具有标记的图像进行多次下采样操作，获得多个第一特征图；对所述多个第一特征图分别进行卷积操作，获得所述多个第一特征图各自的中间特征图；根据多个第一特征图及其各自的中间特征图进行图像重建处理，获得去标记的图像。 2.根据权利要求1所述的方法，其中，所述根据多个第一特征图及其各自的中间特征图进行图像重建处理，获得去标记图像，包括：对所述多个第一特征图中尺寸最小的第一特征图进行一次上采样操作，得到第二特征图；将所述第二特征图与所述多个第一特征图之中相同大小的第一特征图进行拼接处理，获得第一融合特征图；对所述第一融合特征图进行上采样操作，得到新的第二特征图；基于新的第二特征图的尺寸与所述具有标记的图像的尺寸相同，将与所述具有标记的图像的尺寸相同的新的第二特征图，确定为去标记图像。 3.根据权利要求1所述的方法，其中，所述对所述多个第一特征图分别进行卷积操作，获得所述多个第一特征图各自的中间特征图，包括：对所述多个第一特征图的通道数分别进行缩小，得到所述多个第一特征图各自的第一中间特征图；对所述多个第一中间特征图分别进行卷积操作，得到所述多个第一中间特征图各自的第二中间特征图；对所述多个第二中间特征图的通道数分别进行扩大，获得所述多个第一特征图各自的中间特征图。 4.根据权利要求1所述的方法，其中，所述对所述具有标记的图像进行多次下采样操作，获得多个第一特征图，包括：将所述具有标记的图像输入至预先训练的生成器；所述生成器包括下采样层、上采样层和上采样融合模块；获得所述下采样层对所述具有标记的图像进行多次下采样操作后输出的多个第一特征图；其中，所述对所述多个第一特征图分别进行卷积操作，获得所述多个第一特征图各自的中间特征图，包括：获得所述上采样融合模块对所述多个第一特征图的通道数分别进行缩小后输出的所述多个第一特征图各自的第一中间特征图；获得所述上采样融合模块对所述多个第一中间特征图分别进行卷积操作后输出的所述多个第一中间特征图各自的第二中间特征图；获得所述上采样融合模块对所述多个第二特征图的通道数分别进行扩大后输出的所述多个第二中间特征图各自的中间特征图。 5.根据权利要求4所述的方法，其中，所述根据多个第一特征图及其各自的中间特征图进行图像重建处理，获得去标记图像，包括：权　利　要　求　书 1/5 页 2 CN 114495110 A 2获得所述上采样层对所述多个第一特征图中尺寸最小的第一特征图进行一次上采样操作后输出的第二特征图；获得所述上采样融合模块将所述第二特征图与所述多个第一特征图之中相同大小的第一特征图进行拼接处理后输出的第一融合特征图；获得所述上采样层对所述第一融合特征图进行上采样操作后输出的新的第二特征图；基于新的第二特征图的尺寸与所述具有标记的图像的尺寸相同，将与所述具有标记的图像的尺寸相同的新的第二特征图，确定为去标记图像。 6.一种生成器训练方法，所述训练方法包括：获取具有标记的样本图像及获取真实图像；所述真实图像为未具有标记的的所述样本图像；将所述具有标记的样本图像输入所述生成器；获取所述生成器对所述具有标记的样本图像进行多次下采样操作，得到的多个第一样本特征图；获取所述生成器对所述多个第一样本特征图分别进行卷积操作，得到的所述多个第一样本特征图各自的中间样本特征图；获取所述生成器根据多个第一样本特征图及其各自的中间样本特征图进行图像重建处理，获得的去标记样本图像；将所述真实图像与所述具有标记的样本图像在通道上进行拼接，得到真图；将所述去标记样本图像与所述具有标记的样本图像在通道上进行拼接，得到伪图；将所述真图和所述伪图分别输入至判别器，获得所述真图的第一判别结果和所述伪图的第二判别结果；根据所述第一判别结果和第二判别结果计算第一损失值，并根据所述第一损失值训练判别器；根据所述去标记样本图像、所述真实图像和训练的所述判别器计算第二损失值，基于所述第二损失值训练所述生成器。 7.根据权利要求6所述的方法，其中，所述根据所述去标记样本图像、所述真实图像和训练的所述判别器计算第二损失值，包括：根据所述真实图像和所述去标记样本图像计算第三损失值；对所述真实图像进行文字分割处理得到第一文字分割特征图，并对所述去标记样本图像进行文字分割处理得到第二文字分割特征图，根据所述第一文字分割特征图和第二文字分割特征图计算第四损失值；将所述去标记样本图像输入至训练的所述判别器以得到判别结果，并根据所述判别结果计算第五损失值；根据所述第三损失值、所述第四损失值和所述第五损失值，生成所述第二损失值。 8.根据权利要求7所述的方法，其中，所述对所述真实图像进行文字分割处理得到第一文字分割特征图，并对所述去标记样本图像进行文字分割处理得到第二文字分割特征图，包括：将所述去标记样本图像输入预先训练的文字分割模型，对所述去标记样本图像进行文字分割，得到第一文字分割特征图；权　利　要　求　书 2/5 页 3 CN 114495110 A 3

专利 图像处理方法、生成器训练方法、装置及存储介质

专利图像处理方法、生成器训练方法、装置及存储介质