[发明专利]一种票据识别的方法及系统在审

专利信息
申请号: 201810424250.6 申请日: 2018-05-07
公开(公告)号: CN110457973A 公开(公告)日: 2019-11-15
发明(设计)人: 夏子国;王绪胜;陈雪原;张启峰;安云生;吴俊飞;张鹏;李国权;聂广楠;刘蕾;刘宁;姚涛 申请(专利权)人: 北京中海汇银财税服务有限公司
主分类号: G06K9/00 分类号: G06K9/00;G06K9/62
代理公司: 暂无信息 代理人: 暂无信息
地址: 100000北京市西*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 票据识别 票据要素 解析 票据 本次操作 输出识别 校验和 标准模板库 企业信息化 标准模板 补充数据 结果信息 票据类型 票据图像 文本特征 准确度 失败 标准化 补充 成功
【权利要求书】:

1.一种票据识别的方法,其特征在于,具体步骤如下:

S1、建立票据标准模板库,所述票据标准模板库包括票据分类库、每类票据的分类特征库、每类票据的票据标准模板;

每类票据的分类特征库包括每类票据的分类特征,每类票据的分类特征是指本类票据区别于其他类票据的特点,包括图像特征、文本识别结果特征;

所述票据标准模板,包括票据标准图像的方向及大小、各个票据要素在该票据标准图像中的位置、大小及语义特征、参照要素及参照要素在该标准图像中的位置和大小,其中:

所述票据要素,是指票据中的具有独立含义、用于描述票据的数据项;

所述语义特征,是指票据要素的文本或其上下文所具有的,能与其他票据要素相区别的独有特征;

所述参照要素,是指票据要素中人为选取的、在票据标准图像中位置和大小相对固定、识别出错率低的一个或多个票据要素;

S2、预识别票据,接收票据原始图像,将票据原始图像提交给识别引擎进行图像预识别得到预识别结果,其中:

预识别结果包括票据原始图像的方向、识别出的字符列表及各字符在票据原始图像中的位置;

S3、确定票据类型和票据标准模板,根据票据原始图像及其预识别结果文本,与每类票据的分类特征库进行比对,确定票据的类型,根据票据类型,从票据标准模板库提取出与之对应的票据标准模板;

S4、解析预识别结果,根据票据标准模板中参照要素的语义特征,获取参照要素在票据原始图像上的位置和大小,如果获取成功,则进入步骤S5,如果获取失败,则输出识别失败的结果信息并结束本次操作;

S5、标准化票据图像,根据预识别结果中票据原始图像方向、参照要素在票据原始图像上的位置和大小及参照元素在票据标准图像中的位置和大小,将票据原始图像转换为与票据标准图像方向、大小相同,且参照元素在转换后图像中的位置、大小与其在标准票据图像的位置、大小一致的图像,完成后进入步骤S6;

S6、正式识别票据,将标准化后的票据图像提交给识别引擎进行正式识别得到正式识别的结果,然后进入步骤S7,其中:

正式识别的结果包括识别出的字符列表及各字符在标准化图像中的位置和大小;

S7、解析票据要素,从正式识别结果中逐个解析出票据要素的值,解析完成后进入步骤S8,其中:

解析时优先按照票据要素的语义特征进行解析,若语义解析失败,则通过票据标准模板中本票据要素的绝对位置定位识别出票据要素的值;

S8、校验和补充票据要素数据,根据各票据要素的文本特征和票据要素的相互关系校验和补充数据,完成后进入步骤S9;

S9、输出识别的各票据要素,结束本次操作。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京中海汇银财税服务有限公司,未经北京中海汇银财税服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810424250.6/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top