[发明专利]应用于手持设备的发票信息识别设备及发票信息识别方法在审

专利信息
申请号: 201310215864.0 申请日: 2013-06-03
公开(公告)号: CN103295001A 公开(公告)日: 2013-09-11
发明(设计)人: 卢迪;刘建新;曲凤龙 申请(专利权)人: 哈尔滨理工大学
主分类号: G06K9/00 分类号: G06K9/00;G06K9/20;G06K9/66
代理公司: 哈尔滨东方专利事务所 23118 代理人: 陈晓光
地址: 150040 黑龙江省哈*** 国省代码: 黑龙江;23
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 应用于 手持 设备 发票 信息 识别 方法
【权利要求书】:

1.一种应用于手持设备的发票信息识别设备,其组成包括: 主控制器,其特征是:装有Linux操作系统内核、Android系统核心、发票信息提取软件的所述的主控制器分别与显示器、摄像头、锂电池连接,所述的摄像头为捕捉发票图像的设备,在主控制器的控制下,获取发票的数字图像,然后通过识别算法将发票中包含的文本信息提取出来;所述的显示器是显示发票图像和发票信息提取处理结果的设备,接受主控制器传送来的数据,将图像和处理结果显示出来;所述的锂电池给整个手持设备供电。

2.一种根据权利要求1所述的应用于手持设备的发票信息识别设备进行的识别方法,其特征是:装有Linux操作系统内核、Android系统核心、发票信息提取软件的所述的主控制器分别与显示器、摄像头、锂电池连接,所述的发票信息提取软件主要通过图像识别算法实现发票图像信息的提取,所述的图像识别算法步骤包括:图像二值化方法、文本区域提取、文本区域分割、字符纹理特征提取、字符特征分类、字符串重组、字符串语义分析、信息提取。

3.根据权利要求1或2所述的应用于手持设备的发票信息识别方法,其特征是:所述的Linux操作系统为内核,在硬件的基础上实现了设备驱动、任务实时调度、内存管理、文件系统等部分,为上层应用提供了Linux的应用编程接口,Linux内核主要使用汇编语言和C语言编写;所述的Android系统核心是以Linux内核为基础构建的Java接口的操作系统外壳,它在Linux内核的基础上构建了统一的图形界面接口、数据库接口、驱动控制接口,为上层Java应用提供了接口支持,Android系统核心使用C++和Java语言编写,主要对上层Java应用程序提供Java虚拟机和接口库的支持;所述的发票识别软件的主要功能是为用户提供操作界面,使用户能够拍摄发票、识别发票并将处理结果保存起来或者发送出去,识别软件以Android系统为基础,使用Java编写,通过调用Android系统提供的各种APIs来实现图形GUI、摄像头控制、发票识别以及信息保存发送的功能。

4.根据权利要求书2或3所述的应用于手持设备发票信息识别方法,其特征是:所述的图像二值化方法是基于直方图方法的局部二值化方法,方法步骤如下:

    1)首先,本方法将图像分割成若干方块,方块的尺寸根据拍摄的图像中文字大小来确定,图像的长宽大约为两个文字的长宽;

    2)然后,将图像方块进行直方图分析,找出图像中的像素分布;

    3)接着,遍历直方图,找出直方图中相邻5个像素区域内像素差值较大,像素总和较大且呈波峰状分布的区域,其中的峰值像素点就是图像的预估计背景灰度,记为Tbij;

       4)抽取图像方块直方图中Tbij旁边的像素分布,作为正态分布估计的基础;

将分布值带入正态分布,以此估计出正太分布参数;

    5)将正态分布中分布较大的区域去掉,以此找出图像中非背景部分的会度分布,如果图像中的其他区域分布较窄或者分布值较小,就可以认为图像中没有前景,既全是背景,但如果图像中具有宽度和福值都较大的分布区域,这里就是图像中的前景,将背景边缘和前景边缘的中心作为图像方块的预估计阈值;

    6)按照上述方法将所有图像方块的预估计阈值,作为图像的阈值计算的基础;

    7)图像最终阈值根据预估计阈值进行计算;

    8)将图像与阈值进行比较,从而得到图像的二值图像;

经过上述计算,得到的图像就是二值图像。

5.根据权利要求书2或3所述的应用于手持设备发票信息识别方法,其特征是:所述的文本区域分割方法基于形态学,由于图像中的文字笔画都是具有连贯性的图像元素,因此,可以使用形态学方法对整个图像进行分析:

    1)使用直径5像素的圆形结构体对权利1中得到的二值图像进行形态学膨胀,得到膨胀后的二值图像;

    2)使用标记法对上步骤中得到的膨胀二值图像进行分割,从而得到一组具有类似矩形的二值区域,将这一区域的文字二值图像作为一组文字;

    3)通过横向和纵向的空像素行对文本行进行分割,将文本行分割成单独字符图像,作为后续字符识别和字符串重组的基础;

经过上述步骤,就可以得到一系列单独的字符二值图像,用于后续字符识别。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨理工大学,未经哈尔滨理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201310215864.0/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top