[发明专利]基于OCR的财务报表信息检测和识别方法在审

专利信息
申请号: 202010898577.4 申请日: 2020-08-31
公开(公告)号: CN112016481A 公开(公告)日: 2020-12-01
发明(设计)人: 李振;鲁宾宾;刘挺;刘昊霖;翟昶;陈远琴;母丹;王子祎 申请(专利权)人: 民生科技有限责任公司
主分类号: G06K9/00 分类号: G06K9/00;G06K9/20;G06K9/34;G06K9/40
代理公司: 北京金智普华知识产权代理有限公司 11401 代理人: 巴晓艳
地址: 101300 北*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 ocr 财务报表 信息 检测 识别 方法
【权利要求书】:

1.一种基于OCR的财务报表信息检测和识别方法,其特征在于,所述方法包括如下步骤:

S1、识别财务报表图像的非表格区域,提取非表格区域信息;

S2、对财务报表图像的表格区域进行细分识别,得到所有的数据单元格,按照所述数据单元格进行子图切分;

S3、对步骤S2中切分出的子图进行文本检测,识别出子图中的文本区域;

S4、对经步骤S3文本识别后的文本区域进行文本识别;

S5、将表格区域和非表格区域的文本识别内容进行排版整合,以结构化的方式输出财务报表信息。

2.如权利要求1所述的基于OCR的财务报表信息检测和识别方法,其特征在于,在步骤S1之前,对财务报表图像进行图像预处理,所述图像预处理具体为:

S0.1对输入的财务报表图像进行二值化处理:设置阈值,根据每个像素点的色值将其转化为纯白色或者纯黑色,将文本图像转化成噪声点较少的白底黑字图像;

S0.2对经步骤S0.1处理后的图像进行形态学处理,消除单个字周围毛刺,减少单个字内的空白,使得每个字符成为紧凑的字团;所述形态学处理包括腐蚀、膨胀。

3.如权利要求1所述的基于OCR的财务报表信息检测和识别方法,其特征在于,所述方法还包括:

S6、根据会计准则设置科目间的配平规则,对步骤S5中输出的财务报表信息进行配平校验,若OCR结果通过配平校验,则输出的为正确识别结果;否则,继续进行OCR识别,调整识别结果。

4.如权利要求1所述的基于OCR的财务报表信息检测和识别方法,其特征在于,步骤S1中,提取非表格区域信息的具体步骤包括:

S1.1在财务报表图像的水平方向上进行投影,得到图像高度像素数条水平方向的黑色像素累加值,做分布图,并找出累加值接近最大值的多条水平线位置;

S1.2选择最上方的一条水平线和最下方的一条水平线分别为分割非表格区域和表格区域的起始基准线和终止基准线;

S1.3在所述起始基准线上方截取紧邻的一行文字行,在所述终止基准线下方截取紧邻的一行文字行,对文字行进行文本检测和文本识别,得到文字行的内容;

S1.4将识别出的所述起始基准线上方文字行的内容与收集的财务报表术语词数据库的条目进行比对,若不在所述数据库中,则所述起始基准线即为分割表格区域和非表格区域的起始水平线;若在所述数据库中,则起始水平线位置由所述起始基准线位置减去该文字行的高度得到;同样,将识别出的所述终止基准线下方文字行的内容与收集的财务报表术语词数据库的条目进行比对,若不在所述数据库中,则所述终止基准线即为分割表格区域和非表格区域的终止水平线;若在所述数据库中,则终止水平线位置由所述终止基准线位置加上该文字行的高度得到;

S1.5所述起始水平线和终止水平线之间的区域为表格区域,所述表格区域外为非表格区域。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于民生科技有限责任公司,未经民生科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010898577.4/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top