iso file download
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211110267.7 (22)申请日 2022.09.13 (71)申请人 共青科技职业学院 地址 330000 江西省九江市共青城 共青大 道1号 (72)发明人 周翔 冯莉颖  (74)专利代理 机构 北京清亦华知识产权代理事 务所(普通 合伙) 11201 专利代理师 何世磊 (51)Int.Cl. G06F 16/953(2019.01) G06F 16/9538(2019.01) G06F 16/332(2019.01) G06F 40/30(2020.01) G06F 40/242(2020.01)G06F 40/289(2020.01) (54)发明名称 页面数据处理方法、 装置、 电子设备及存储 介质 (57)摘要 本发明提供了一种页面数据处理方法、 装 置、 电子设备及存储介质, 属于数据处理的技术 领域, 所述方法包括获取预设筛查信息的控制指 令; 根据词义筛查条件从待筛查页面中筛查出目 标页面; 针对目标页面中的数据文本进行识别以 获取待处理数据; 根据数据筛选条件从待处理数 据中剔除非目标数据, 以筛选出目标数据; 根据 目标数据与预设阈值的关系, 针对目标数据进行 相应的处理。 通过本申请, 可以实现从海量的待 待筛查页面自动获取及摘抄符合预设筛查信息 所需的数据信息, 可以解决用户逐一对不同页面 上的关联信息进行逐项、 逐页的浏览查找所需信 息, 以及将找出的所需信息人为摘抄汇集而导致 严重影响对页面数据信息处 理效率的弊端。 权利要求书2页 说明书10页 附图4页 CN 115455272 A 2022.12.09 CN 115455272 A 1.一种页面数据处 理方法, 其特 征在于, 包括: 获取预设筛查信 息的控制 指令; 其中, 所述预设筛查信 息包括词义筛查条件、 数据筛选 条件及预设阈值; 根据所述词义筛查条件从待筛查页面中筛查出目标页面; 针对所述目标页面中的数据文本进行识别以获取待处理数据; 其中, 所述待处理数据 包括目标 数据和非目标 数据; 根据所述数据筛选条件从所述待处理数据中剔除所述非 目标数据, 以筛选出所述目标 数据; 根据所述目标 数据与所述预设阈值的关系, 针对所述目标 数据进行相应的处 理。 2.根据权利要求1所述的页面数据处理方法, 其特征在于, 所述根据所述词义筛查条件 从待筛查页面中筛查出目标页面的步骤具体包括: 将所述词义筛查条件 采取分词方式以获取与所述控制指令相符的筛查关键词; 针对所述筛查关键词进行 标准化处理转换成符合预设词典内的标准 查询词; 根据所述标准 查询词从所述待筛查页面中筛查出符合所述词义筛查条件目标页面。 3.根据权利要求1所述的页面数据处理方法, 其特征在于, 所述针对所述目标页面中的 数据文本进行识别以获取待处 理数据的步骤具体包括: 针对所述目标页面中的表类数据进行抓取以获取待处 理图片; 针对所述待处 理图片进行 预处理以获取 预处理图像; 针对所述预处 理图像进行识别处 理以获取 所述待筛查页面中所需的待处 理数据。 4.根据权利要求3所述的页面数据处理方法, 其特征在于, 所述预处理包括灰度处理及 图像增强处 理。 5.根据权利要求1所述的页面数据处理方法, 其特征在于, 所述根据所述数据筛选条件 从所述待处 理数据中剔除所述非目标 数据, 以筛 选出所述目标 数据的步骤具体包括: 将所述数据筛 选条件所包 含的字符进行分割处 理以获取多个 配置字符; 基于所述多个配置字符从预设条件库中筛选出与所述数据筛选条件适配的目标条件 式; 将所述目标条件式在所述待处理数据中所对应的数据进行保留以归集形成所述目标 数据, 且将所述待处理数据中未被归集的所述非目标数据丢弃, 以使从所述待处理数据中 筛选出所述目标 数据。 6.根据权利要求1所述的页面数据处理方法, 其特征在于, 所述根据所述目标数据与 所 述预设阈值的关系, 针对所述目标 数据进行相应的处 理的步骤具体包括: 将所述目标数据中的数据逐一与 所述预设阈值求差得到差值, 判断所述差值是否小于 零; 若是, 则将所述差值小于零所对应的所述目标数据输出, 并推送输出的所述目标数据 对应的所述目标页面。 7.根据权利要求6所述的页面数据处理方法, 其特征在于, 所述判断所述差值是否小于 零的步骤之后, 所述方法还 包括: 若判断所述差值不小于零, 则将所述差值不小于零所对应的所述目标数据丢弃, 并输 出无符合所述预设筛查信息的提 示信息。权 利 要 求 书 1/2 页 2 CN 115455272 A 28.一种页面数据处 理装置, 其特 征在于, 包括: 获取模块, 用于获取预设筛查信息的控制 指令; 其中, 所述预设筛查信息包括词义筛查 条件、 数据筛 选条件及预设阈值; 筛查模块, 用于根据所述词义筛查条件从待筛查页面中筛查出目标页面; 识别模块, 用于针对所述目标页面中的数据文本进行识别以获取待处理数据; 其中, 所 述待处理数据包括目标 数据和非目标 数据; 筛选模块, 用于根据所述数据筛选条件从所述待处理数据中剔除所述非目标数据, 以 筛选出所述目标 数据; 处理模块, 用于根据所述目标数据与所述预设阈值的关系, 针对所述目标数据进行相 应的处理。 9.一种电子设备, 包括存储器、 处理器以及存储在所述存储器上并可在所述处理器上 运行的计算机程序, 其特征在于, 所述处理器执行所述计算机程序时实现如权利要求1至7 中任一项所述的页面数据处 理方法。 10.一种存储介质, 其上存储有计算机程序, 其特征在于, 该程序被处理器执行时实现 如权利要求1至7中任一项所述的页面数据处 理方法。权 利 要 求 书 2/2 页 3 CN 115455272 A 3

PDF文档 专利 页面数据处理方法、装置、电子设备及存储介质

文档预览
中文文档 17 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 页面数据处理方法、装置、电子设备及存储介质 第 1 页 专利 页面数据处理方法、装置、电子设备及存储介质 第 2 页 专利 页面数据处理方法、装置、电子设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:13:52上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。