[发明专利]应用于手持设备的发票信息识别设备及发票信息识别方法在审

申请号：	201310215864.0	申请日：	2013-06-03
公开（公告）号：	CN103295001A	公开（公告）日：	2013-09-11
发明（设计）人：	卢迪;刘建新;曲凤龙	申请（专利权）人：	哈尔滨理工大学
主分类号：	G06K9/00	分类号：	G06K9/00;G06K9/20;G06K9/66
代理公司：	哈尔滨东方专利事务所 23118	代理人：	陈晓光
地址：	150040 黑龙江省哈***	国省代码：	黑龙江;23
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	应用于手持设备发票信息识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域：

本发明涉及一种识别发票信息的手持设备和使用这种手持设备从发票图像中提取发票有用信息的方法。

背景技术：

当前大多数的发票验证系统使用的是发票中具有的条形码对发票进行验证和识别，但由于并不是所有的发票中都包含条形码，所以这些方法的应用场合会受到限制。另外，也有些发票识别验证系统使用的是专业扫描仪对发票进行扫描，然后通过电脑端软件进行识别和验证，其缺点是设备笨重不宜携带。目前，对于分辨率较低、成像质量较差的数字图像中文字信息的提取研究还存在着诸多难以解决的问题。其中一个主要的原因就是分辨率较低、成像质量较差的图片中存在着许多文本模糊不清的区域，而且图片中的文字大小、字体和位置也不尽相同。因此，现有方法无法广泛应用于手机、平板电脑等手持设备拍摄的发票图像中进行信息提取。

发明内容：

本发明的目的在于提供一种应用于手持设备的发票信息识别设备及发票信息识别方法。

本发明的目的是这样实现的：

一种应用于手持设备的发票信息识别设备，其组成包括: 主控制器，装有Linux操作系统内核、Android系统核心、发票信息提取软件的所述的主控制器分别与显示器、摄像头、锂电池连接，所述的摄像头为捕捉发票图像的设备，在主控制器的控制下，获取发票的数字图像，然后通过识别算法将发票中包含的文本信息提取出来；所述的显示器是显示发票图像和发票信息提取处理结果的设备，接受主控制器传送来的数据，将图像和处理结果显示出来；所述的锂电池给整个手持设备供电。

一种应用于手持设备的发票信息识别方法，装有Linux操作系统内核、Android系统核心、发票信息提取软件的所述的主控制器分别与显示器、摄像头、锂电池连接，所述的发票信息提取软件主要通过图像识别算法实现发票图像信息的提取，所述的图像识别算法步骤包括：图像二值化方法、文本区域提取、文本区域分割、字符纹理特征提取、字符特征分类、字符串重组、字符串语义分析、信息提取。

所述的Linux操作系统为内核，在硬件的基础上实现了设备驱动、任务实时调度、内存管理、文件系统等部分，为上层应用提供了Linux的应用编程接口，Linux内核主要使用汇编语言和C语言编写；所述的Android系统核心是以Linux内核为基础构建的Java接口的操作系统外壳，它在Linux内核的基础上构建了统一的图形界面接口、数据库接口、驱动控制接口，为上层Java应用提供了接口支持，Android系统核心使用C++和Java语言编写，主要对上层Java应用程序提供Java虚拟机和接口库的支持；所述的发票识别软件的主要功能是为用户提供操作界面，使用户能够拍摄发票、识别发票并将处理结果保存起来或者发送出去，识别软件以Android系统为基础，使用Java编写，通过调用Android系统提供的各种APIs来实现图形GUI、摄像头控制、发票识别以及信息保存发送的功能。

所述的图像二值化方法是基于直方图方法的局部二值化方法，方法步骤如下：

1）首先，本方法将图像分割成若干方块，方块的尺寸根据拍摄的图像中文字大小来确定，图像的长宽大约为两个文字的长宽；

2）然后，将图像方块进行直方图分析，找出图像中的像素分布；

3）接着，遍历直方图，找出直方图中相邻5个像素区域内像素差值较大，像素总和较大且呈波峰状分布的区域，其中的峰值像素点就是图像的预估计背景灰度，记为Tbij；

4）抽取图像方块直方图中Tbij旁边的像素分布，作为正态分布估计的基础。将分布值带入正态分布，以此估计出正太分布参数；

5）将正态分布中分布较大的区域去掉，以此找出图像中非背景部分的会度分布，如果图像中的其他区域分布较窄或者分布值较小，就可以认为图像中没有前景，既全是背景，但如果图像中具有宽度和福值都较大的分布区域，这里就是图像中的前景，将背景边缘和前景边缘的中心作为图像方块的预估计阈值；

6）按照上述方法将所有图像方块的预估计阈值，作为图像的阈值计算的基础；

7）图像最终阈值根据预估计阈值进行计算；

8）将图像与阈值进行比较，从而得到图像的二值图像；

经过上述计算，得到的图像就是二值图像；

所述的文本区域分割方法基于形态学，由于图像中的文字笔画都是具有连贯性的图像元素，因此，可以使用形态学方法对整个图像进行分析：

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。