iso file download
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211204015.0 (22)申请日 2022.09.29 (71)申请人 维沃移动通信有限公司 地址 523863 广东省东莞 市长安镇维沃路1 号 (72)发明人 海同舟  (74)专利代理 机构 北京远志博慧知识产权代理 事务所 (特殊普通合伙) 11680 专利代理师 李翠雅 (51)Int.Cl. G06F 40/58(2020.01) G06V 30/14(2022.01) G06V 10/82(2022.01) G06F 40/284(2020.01)G06F 40/289(2020.01) G06F 40/30(2020.01) (54)发明名称 文本翻译方法、 装置、 电子设备及存 储介质 (57)摘要 本申请公开了一种文本翻译方法、 装置、 电 子设备及存储介质, 属于图像技术领域。 该方法 包括获取待翻译图像的M个文本区域中的文本行 信息, 每个文本区域中包含一行文本; 基于文本 行信息, 对待翻译图像划分, 得到N个待翻译区 域; 其中, 任一文本区域对应的文本行信息包括 以下至少之一: 任一文本区域的位置信息, 任一 文本区域中的文本行的排版信息, 任一文本区域 中的文本信息 。 权利要求书2页 说明书11页 附图2页 CN 115481644 A 2022.12.16 CN 115481644 A 1.一种文本翻译方法, 其特 征在于, 所述方法包括: 获取待翻译图像的M个文本区域中的文本行信息, 每 个文本区域中包 含一行文本; 基于所述文本行信息, 对所述待翻译图像划分, 得到N个待翻译区域; 其中, 任一文本区域对应的文本行信 息包括以下至少之一: 任一文本区域的位置信 息, 任一文本区域中的文本行的排版信息, 任一文本区域中的文本信息 。 2.根据权利要求1所述的方法, 其特征在于, 基于所述文本行信息, 对所述待翻译图像 划分, 得到N个待翻译区域, 包括: 对所述M个文本区域中的文本行进行卷积处理, 得到所述M个文本区域中的文本行的视 觉特征信息; 对所述M个文本区域中的文本行进行分词处理, 得到所述M个文本区域中的文本行的语 义特征信息; 根据所述文本行信息、 所述视觉特征信息和所述语义特征信息, 对所述待翻译图像进 行划分, 得到所述 N个待翻译区域。 3.根据权利要求2所述的方法, 其特征在于, 所述对所述M个文本区域中的文本行进行 分词处理, 得到所述M个文本区域中的文本行的语义特 征信息, 包括: 根据所述M个文本区域中的文本行的文本, 确定文本序列, 所述文本序列为对所述M个 文本区域中的文本行的文本进行分词得到的序列; 对所述文本序列中的文本进行编码处理, 得到所述M个文本区域中的文本行的语义特 征信息。 4.根据权利要求2所述的方法, 其特征在于, 所述根据所述文本行信息、 所述视觉特征 信息和所述语义特 征信息, 对所述待翻译图像进行划分, 得到N个待翻译区域, 包括: 对所述文本行信息、 所述视觉特征信息和所述语义特征信息进行转化处理, 得到目标 概率值, 所述目标概 率值用于表征 所述待翻译图像中的M个文本区域是否合并的概 率。 5.根据权利要求1所述的方法, 其特征在于, 所述基于所述文本行信息, 对所述待翻译 图像划分, 得到N个待翻译区域之后, 所述方法还 包括: 基于采集到的用户注视所述待翻译图像的注视信 息, 确定所述用户在屏幕上的注视点 的位置信息; 基于所述位置信 息, 从所述N个待翻译区域中确定目标待翻译区域, 并翻译所述目标待 翻译区域中的文本段落。 6.一种文本翻译装置, 其特 征在于, 所述文本翻译装置包括: 获取模块和处 理模块; 所述获取模块, 用于获取待翻译图像的M个文本区域中的文本行信 息, 每个文本区域中 包含一行文本; 所述处理模块, 用于基于所述文本行信息, 对所述待翻译图像划分, 得到N个待翻译区 域; 其中, 任一文本区域对应的文本行信 息包括以下至少之一: 任一文本区域的位置信 息, 任一文本区域中的文本行的排版信息, 任一文本区域中的文本信息 。 7.根据权利要求6所述的装置, 其特征在于, 所述处理模块, 具体用于对所述M个文本区 域中的文本行进行卷积处理, 得到所述M个文本区域中的文本行的视觉特征信息; 并对所述 M个文本区域中的文本行进行分词处理, 得到所述M个文本区域中的文本行的语义特征信权 利 要 求 书 1/2 页 2 CN 115481644 A 2息; 以及根据所述文本行信息、 所述视觉特征信息和所述语义特征信息, 对所述待翻译图像 进行划分, 得到所述 N个待翻译区域。 8.根据权利要求7所述的装置, 其特征在于, 所述处理模块, 具体用于根据 所述M个文本 区域中的文本行的文本, 确定文本序列, 所述文本序列为对所述M个文本区域中的文本行的 文本进行分词得到的序列; 并对 所述文本序列中的文本进行编 码处理, 得到所述M个文本区 域中的文本行的语义特 征信息。 9.根据权利要求7所述的装置, 其特征在于, 所述处理模块, 具体用于对所述文本行信 息、 所述视觉特征信息和所述语义特征信息进行转化处理, 得到目标概率值, 所述目标概率 值用于表征 所述待翻译图像中的M个文本区域是否合并的概 率。 10.根据权利要求6所述的装置, 其特征在于, 所述文本翻译装置包括: 确定模块和翻译 模块; 所述确定模块, 用于所述处理模块基于所述文本行信息, 对所述待翻译图像划分, 得到 N个待翻译区域之后, 基于采集到的用户注视所述待翻译图像的注视信息, 确定所述用户在 屏幕上的注视点的位置信息; 所述翻译模块, 用于基于所述确定模块确定的所述位置信 息, 从所述N个待翻译区域中 确定目标待翻译区域, 并翻译所述目标待翻译区域中的文本段落。 11.一种电子设备, 其特征在于, 包括处理器, 存储器及存储在所述存储器上并可在所 述处理器上运行的程序或指 令, 所述程序或指 令被所述处理器执行时实现如权利要求 1至5 中任一项所述的文本翻译方法的步骤。 12.一种可读存储介质, 其特征在于, 所述可读存储介质上存储程序或指令, 所述程序 或指令被处 理器执行时实现如权利要求1至 5中任一项所述的文本翻译方法的步骤。权 利 要 求 书 2/2 页 3 CN 115481644 A 3

PDF文档 专利 文本翻译方法、装置、电子设备及存储介质

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 文本翻译方法、装置、电子设备及存储介质 第 1 页 专利 文本翻译方法、装置、电子设备及存储介质 第 2 页 专利 文本翻译方法、装置、电子设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:13:42上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。