(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211119180.6
(22)申请日 2022.09.13
(71)申请人 中电金信软件 有限公司
地址 100192 北京市海淀区西小口路6 6号
东升科技园C1
(72)发明人 马敏 侯银科
(74)专利代理 机构 北京清亦华知识产权代理事
务所(普通 合伙) 11201
专利代理师 张润
(51)Int.Cl.
G06V 30/41(2022.01)
G06V 30/19(2022.01)
G06F 40/30(2020.01)
G06Q 40/00(2012.01)
(54)发明名称
财务报表处 理方法及装置
(57)摘要
本公开关于一种财务报表处理方法及 装置,
方法包括: 基于光学字符识别技术, 对待处理财
务报表进行内容识别, 以得到待处理财务报表的
结构化内容信息; 针对多个科目信息中的任一科
目信息, 根据任一科目信息中的科目分类名称,
确定与任一科目信息中的科目分类名 称语义匹
配的目标科目分类名称; 根据任一科目信息中的
科目分类名称 对应的目标科目分类名称, 对结构
化内容信息进行更新, 向客户端发送更新后的结
构化内容信息, 由此, 无需人工手动录入财务报
表中的内容信息, 节省了大量时间和人力, 并提
高了财务报表的内容信息的正确性, 还可实现将
不同财务报表中不同的科目分类名称, 转换成设
定科目分类名称, 便 于相关人员分析。
权利要求书3页 说明书17页 附图6页
CN 115457578 A
2022.12.09
CN 115457578 A
1.一种财务报表处 理方法, 其特 征在于, 包括:
获取待处 理财务报表;
基于光学字符识别技术OCR, 对所述待处理财务报表进行内容识别, 以得到所述待处理
财务报表的结构化内容信息, 其中, 所述结构化内容信息中包括所述待处理财务报表的多
个科目信息以及与所述多个科目信息匹配的数据信息;
针对所述多个科目信息中的任一科目信息, 根据所述任一科目信息中的科目分类名
称, 从多个设定科目分类名称中确定与所述任一科目信息中的科目分类名称 语义匹配的目
标科目分类名称;
根据所述任一科目信 息中的科目分类名称对应的目标科目分类名称, 对所述结构化内
容信息进行 更新, 以得到更新后的结构化内容信息;
向客户端发送所述更新后的结构化内容信息, 其中, 所述更新后的结构化内容信息用
于生成目标 财务报表, 并对所述目标 财务报表进行展示。
2.根据权利要求1所述的方法, 其特征在于, 所述针对所述多个科目信 息中的任一科目
信息, 根据所述任一科目信息中的科目分类名称, 从多个设定科目分类名称中确定与所述
任一科目信息中的科目分类名称语义匹配的目标 科目分类名称, 包括:
将所述任一科目信息中的科目分类名称, 输入至经过训练的相似文本生成模型中, 以
使所述经过训练的相似文本生成模型从所述多个设定科目分类名称中进 行语义检索, 并输
出与所述任一科目信息中的科目分类名称语义匹配的目标 科目分类名称。
3.根据权利要求2所述的方法, 其特征在于, 所述相似文本生成模型经过以下步骤训练
得到:
获取样本科目分类名称以及所述样本科目分类名称对应的设定科目分类名称;
将所述样本科目分类名称输入至初始的相似文本生成模型中, 所述初始的相似文本生
成模型从所述多个设定科目分类名称中进 行语义检索, 并输出与所述样本科目分类名称 语
义匹配的预测科目分类名称;
根据所述预测科目分类名称与对应的设定科目分类名称之间的差异, 对所述初始的相
似文本生成模型进行训练。
4.根据权利要求1所述的方法, 其特征在于, 所述针对所述多个科目信 息中的任一科目
信息, 根据所述任一科目信息中的科目分类名称, 从多个设定科目分类名称中确定与所述
任一科目信息中的科目分类名称语义匹配的目标 科目分类名称, 包括:
获取参考科目分类名称列表, 其中, 所述参考科目分类名称列表中包括所述多个设定
科目分类名称, 以及与所述多个设定科目分类名称中各设定科目分类名称语义匹配的至少
一个参考科目分类名称;
根据所述任一科目信息中的科目分类名称, 查询所述参考科目分类名称列表, 以从所
述多个设定科目分类名称中确定与所述任一科目信息中的科目分类名称语义匹配的目标
科目分类名称。
5.根据权利要求1所述的方法, 其特征在于, 所述根据所述任一科目信 息中的科目分类
名称对应的目标科目分类名称, 对所述结构化内容信息进行更新, 以得到更新后的结构化
内容信息, 包括:
根据所述任一科目信 息中的科目分类名称对应的目标科目分类名称, 对所述结构化内权 利 要 求 书 1/3 页
2
CN 115457578 A
2容信息中的任一科目信息中的科目分类名称进行 更新, 以得到更新后的任一科目信息;
根据所述更新后的任一科目信 息以及所述更新后的任一科目信 息对应的数据信 息, 确
定更新后的结构化内容信息 。
6.根据权利要求1 ‑5中任一项所述的方法, 其特征在于, 所述获取待处理财务报表, 包
括:
接收客户端发送的待处 理财务报表。
7.一种财务报表处 理方法, 其特 征在于, 包括:
接收服务端发送 的更新后的结构化内容信息, 其中, 所述更新后的结构化内容信息是
所述服务端基于光学字符识别技术OCR, 对待处理财务报表进 行内容识别, 以得到所述待处
理财务报表的结构化内容信息, 其中, 所述结构化内容信息中包括所述待处理财务报表的
多个科目信息以及与所述多个科目信息匹配的数据信息, 针对所述多个科目信息中的任一
科目信息, 根据所述任一科目信息中的科目分类名称, 从多个设定科目分类名称 中确定与
所述任一科目信息中的科目分类名称 语义匹配的目标科目分类名称, 根据所述任一科目信
息中的科目分类名称对应的目标科目分类名称, 对所述结构化内容信息进行更新所得到
的;
确定所述更新后的结构化内容信息中各字段对应的字段类型和字段长度;
根据所述更新后的结构化内容信息以及所述更新后的结构化内容信息中各字段对应
的字段类型和字段长度, 生成目标 财务报表, 并在展示页面对所述目标 财务报表进行展示;
响应于对所述目标 财务报表的确认操作, 对所述目标 财务报表进行存 储。
8.根据权利要求7 所述的方法, 其特 征在于, 所述方法还 包括:
响应于所述展示页面的表格导出控件的触发操作, 导出所述目标财务报表, 以对导出
后的目标 财务报表进行修改;
响应于所述展示页面的表格导入控件的触发操作, 将修改后的目标财务报表进行导
入, 并在所述展示页面对所述 修改后的目标 财务报表进行展示;
响应于对所述修改后的目标财务报表的确 认操作, 对所述修改后的目标财务报表进行
存储。
9.根据权利要求7 ‑8中任一项所述的方法, 其特 征在于, 所述方法还 包括:
响应于目标操作, 向所述服务端发送待处理财务报表, 其中, 所述待处理财务报表用于
所述服务端基于光学字符识别技术OCR, 对所述待处理财务报表进 行内容识别, 以得到所述
待处理财务报表的结构化内容信息, 其中, 所述结构化内容信息中包括所述待处理财务报
表的多个科目信息以及与所述多个科目信息匹配的数据信息; 针对所述多个科目信息中的
任一科目信息, 根据所述任一科目信息中的科目分类名称, 从多个设定科目分类名称 中确
定与所述任一科目信息中的科目分类名称语义匹配的目标科目分类名称; 根据所述任一科
目信息中的科目分类名称对应的目标科目分类名称, 对所述结构化内容信息进行更新, 以
得到更新后的结构化内容信息, 其中, 所述更新后的结构化内容信息用于生成目标财务报
表, 并对所述目标 财务报表进行展示。
10.一种财务报表处 理装置, 其特 征在于, 包括:
第一获取模块, 用于获取待处 理财务报表;
识别模块, 用于基于光学字符识别技术OCR, 对所述待处理财务报表进行内容识别, 以权 利 要 求 书 2/3 页
3
CN 115457578 A
3
专利 财务报表处理方法及装置
文档预览
中文文档
27 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共27页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-03-03 12:13:52上传分享