[发明专利]票据信息识别方法及装置有效

专利信息
申请号: 201610293318.2 申请日: 2016-05-05
公开(公告)号: CN107346580B 公开(公告)日: 2019-11-05
发明(设计)人: 苏统华 申请(专利权)人: 腾讯科技(深圳)有限公司;哈尔滨工业大学
主分类号: G07D7/20 分类号: G07D7/20
代理公司: 北京三高永信知识产权代理有限责任公司 11138 代理人: 刘映东
地址: 518000 广东省深圳*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 票据 信息 识别 方法 装置
【权利要求书】:

1.一种票据信息识别方法,其特征在于,所述方法包括:

获取票据图像,所述票据图像为待识别的票据图像;

基于所述票据图像中每个像素点的像素值,确定所述票据图像的背景颜色,所述像素值由多种颜色分量组成;

确定所述票据图像中的噪点区域;

基于所述背景颜色,对所述噪点区域的颜色进行处理,得到第一预处理图像;

确定所述第一预处理图像包括的多个字符串的位置;

对于所述多个字符串中的每个字符串,基于所述字符串的位置,从所述第一预处理图像中切割出所述字符串,得到字符串图像;

对所述字符串图像进行切割,得到多张字符图像;

对于所述多张字符图像中的每张字符图像,对所述字符图像进行识别,得到所述字符图像中的字符;

按照所述多张字符图像在所述字符串图像中的顺序,将所述多张字符图像中的字符组成所述票据图像中的信息。

2.如权利要求1所述的方法,其特征在于,所述基于所述票据图像中每个像素点的像素值,确定所述票据图像的背景颜色,包括:

对于所述多种颜色分量中的每种颜色分量,从所述票据图像中每个像素点的像素值中,获取属于所述颜色分量的色彩参数;

基于获取的色彩参数,生成所述颜色分量的色彩数组;

统计指定色彩参数在所述色彩数组中出现的次数,所述指定色彩参数为所述色彩数组包括的色彩参数中的任一色彩参数;

当统计的次数为所述色彩数组中元素个数的一半时,将所述指定色彩参数确定为所述色彩数组的中位数;

将多个色彩数组的中位数所对应的颜色确定为所述票据图像的背景颜色,所述多个色彩数组与所述多种颜色分量一一对应。

3.如权利要求1所述的方法,其特征在于,所述确定所述票据图像中的噪点区域,包括:

从所述票据图像包括的像素点中,获取像素值位于指定像素值范围内的像素点;

将获取的像素点所在的区域和所述票据图像中指定位置的区域确定为所述票据图像中的噪点区域。

4.如权利要求1所述的方法,其特征在于,所述确定所述第一预处理图像包括的多个字符串的位置,包括:

对所述第一预处理图像进行灰度化以及二值化处理,得到第二预处理图像;

基于所述第二预处理图像包括的多行像素点的灰度值,确定多个第一个数,所述多个第一个数中的每个第一个数为所述第二预处理图像中每行像素点中灰度值为第一数值的像素点个数;

基于所述第二预处理图像包括的多列像素点的灰度值,确定多个第二个数,所述多个第二个数中的每个第二个数为所述第二预处理图像中每列像素点中灰度值为所述第一数值的像素点个数;

对于所述多个字符串中的每个字符串,从存储的票据图像模板中,获取多个指定比例值,所述多个指定比例值分别用于指示所述字符串所在表格单元中每个边界与所述票据图像包括的票据表格中对应方向上的指定边界之间的距离,所述指定边界为第一顶点所在的边界,所述第一顶点为所述票据表格的任一顶点;

基于所述多个第一个数、所述多个第二个数以及所述多个指定比例值,确定所述字符串在所述第一预处理图像中的位置。

5.如权利要求4所述的方法,其特征在于,所述基于所述多个第一个数、所述多个第二个数以及所述多个指定比例值,确定所述字符串在所述第一预处理图像中的位置,包括:

基于所述多个第一个数和所述多个第二个数,确定所述第一顶点坐标和所述票据表格的各个边界长度;

基于所述票据表格的各个边界长度和所述多个指定比例值,确定所述字符串所在表格单元中每个边界与所述票据表格中对应边界之间的距离;

基于所述第一顶点坐标和所述字符串所在表格单元中每个边界与所述票据表格中对应边界之间的距离,确定所述字符串在所述第一预处理图像中的位置。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司;哈尔滨工业大学,未经腾讯科技(深圳)有限公司;哈尔滨工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201610293318.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top