[发明专利]应用于手持设备的发票信息识别设备及发票信息识别方法在审

专利信息
申请号: 201310215864.0 申请日: 2013-06-03
公开(公告)号: CN103295001A 公开(公告)日: 2013-09-11
发明(设计)人: 卢迪;刘建新;曲凤龙 申请(专利权)人: 哈尔滨理工大学
主分类号: G06K9/00 分类号: G06K9/00;G06K9/20;G06K9/66
代理公司: 哈尔滨东方专利事务所 23118 代理人: 陈晓光
地址: 150040 黑龙江省哈*** 国省代码: 黑龙江;23
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 应用于 手持 设备 发票 信息 识别 方法
【说明书】:

技术领域:

发明涉及一种识别发票信息的手持设备和使用这种手持设备从发票图像中提取发票有用信息的方法。

背景技术:

当前大多数的发票验证系统使用的是发票中具有的条形码对发票进行验证和识别,但由于并不是所有的发票中都包含条形码,所以这些方法的应用场合会受到限制。另外,也有些发票识别验证系统使用的是专业扫描仪对发票进行扫描,然后通过电脑端软件进行识别和验证,其缺点是设备笨重不宜携带。目前,对于分辨率较低、成像质量较差的数字图像中文字信息的提取研究还存在着诸多难以解决的问题。其中一个主要的原因就是分辨率较低、成像质量较差的图片中存在着许多文本模糊不清的区域,而且图片中的文字大小、字体和位置也不尽相同。因此,现有方法无法广泛应用于手机、平板电脑等手持设备拍摄的发票图像中进行信息提取。

发明内容:

本发明的目的在于提供一种应用于手持设备的发票信息识别设备及发票信息识别方法。

本发明的目的是这样实现的:

一种应用于手持设备的发票信息识别设备,其组成包括: 主控制器,装有Linux操作系统内核、Android系统核心、发票信息提取软件的所述的主控制器分别与显示器、摄像头、锂电池连接,所述的摄像头为捕捉发票图像的设备,在主控制器的控制下,获取发票的数字图像,然后通过识别算法将发票中包含的文本信息提取出来;所述的显示器是显示发票图像和发票信息提取处理结果的设备,接受主控制器传送来的数据,将图像和处理结果显示出来;所述的锂电池给整个手持设备供电。

 一种应用于手持设备的发票信息识别方法,装有Linux操作系统内核、Android系统核心、发票信息提取软件的所述的主控制器分别与显示器、摄像头、锂电池连接,所述的发票信息提取软件主要通过图像识别算法实现发票图像信息的提取,所述的图像识别算法步骤包括:图像二值化方法、文本区域提取、文本区域分割、字符纹理特征提取、字符特征分类、字符串重组、字符串语义分析、信息提取。

所述的Linux操作系统为内核,在硬件的基础上实现了设备驱动、任务实时调度、内存管理、文件系统等部分,为上层应用提供了Linux的应用编程接口,Linux内核主要使用汇编语言和C语言编写;所述的Android系统核心是以Linux内核为基础构建的Java接口的操作系统外壳,它在Linux内核的基础上构建了统一的图形界面接口、数据库接口、驱动控制接口,为上层Java应用提供了接口支持,Android系统核心使用C++和Java语言编写,主要对上层Java应用程序提供Java虚拟机和接口库的支持;所述的发票识别软件的主要功能是为用户提供操作界面,使用户能够拍摄发票、识别发票并将处理结果保存起来或者发送出去,识别软件以Android系统为基础,使用Java编写,通过调用Android系统提供的各种APIs来实现图形GUI、摄像头控制、发票识别以及信息保存发送的功能。

所述的图像二值化方法是基于直方图方法的局部二值化方法,方法步骤如下:

    1)首先,本方法将图像分割成若干方块,方块的尺寸根据拍摄的图像中文字大小来确定,图像的长宽大约为两个文字的长宽;

    2)然后,将图像方块进行直方图分析,找出图像中的像素分布;

    3)接着,遍历直方图,找出直方图中相邻5个像素区域内像素差值较大,像素总和较大且呈波峰状分布的区域,其中的峰值像素点就是图像的预估计背景灰度,记为Tbij;

           4)抽取图像方块直方图中Tbij旁边的像素分布,作为正态分布估计的基础。将分布值带入正态分布,以此估计出正太分布参数;

    5)将正态分布中分布较大的区域去掉,以此找出图像中非背景部分的会度分布,如果图像中的其他区域分布较窄或者分布值较小,就可以认为图像中没有前景,既全是背景,但如果图像中具有宽度和福值都较大的分布区域,这里就是图像中的前景,将背景边缘和前景边缘的中心作为图像方块的预估计阈值;

    6)按照上述方法将所有图像方块的预估计阈值,作为图像的阈值计算的基础;

    7)图像最终阈值根据预估计阈值进行计算;

    8)将图像与阈值进行比较,从而得到图像的二值图像;

经过上述计算,得到的图像就是二值图像;

所述的文本区域分割方法基于形态学,由于图像中的文字笔画都是具有连贯性的图像元素,因此,可以使用形态学方法对整个图像进行分析:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨理工大学,未经哈尔滨理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201310215864.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top