[发明专利]一种发票数据记录方法在审

专利信息
申请号: 201310413333.2 申请日: 2013-09-11
公开(公告)号: CN103488999A 公开(公告)日: 2014-01-01
发明(设计)人: 安俊峰;龚涛;卢萌萌 申请(专利权)人: 东华大学
主分类号: G06K9/62 分类号: G06K9/62;G06K9/60
代理公司: 上海泰能知识产权代理事务所 31233 代理人: 宋缨;孙健
地址: 201620 上海市*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 发票 数据 记录 方法
【说明书】:

技术领域

发明涉及票据记录技术领域,特别是涉及一种发票数据记录和分类统计预测方法。

背景技术

发票是指一切单位和个人在购销商品、提供劳务或接受劳务、服务以及从事其他经营活动,所提供给对方的收付款的书面证明,是财务收支的法定凭证,是会计核算的原始依据,也是审计机关、税务机关执法检查的重要依据。现在各行各业用到对的发票需要报销,但是对于大型的单位发票进行录入操作非常麻烦,亟需一种方便的发票数据记录方法。

发明内容

本发明所要解决的技术问题是提供一种发票数据记录方法,节约成本,方便快捷,省时省力。

本发明解决其技术问题所采用的技术方案是:提供一种发票数据记录方法,包括以下步骤:

(1)获取发票图像信息,将发票图像信息采集到计算机中;

(2)利用matlab软件对发票图像信息进行处理,并且存储数据。

所述步骤(2)包括以下子步骤:

(21)对得到的发票图像信息进行预处理;

(22)采用边缘提取的方式提取发票图像信息,并对发票进行定位;

(23)对定位后的发票进行字符分割和识别;

(24)对识别后的内容进行保存。

所述步骤(23)包括以下子步骤:

(231)将采集的发票图像定位到一定的区域,将发票图像信息的文字图像区域进行分割;

(232)应用边缘分割的方法将发票上的有用字体进行分割出来,从而分离文字区域中的单个字符;

(233)通过比对识别样本库的方法对单个字符进行识别。

所述步骤(2)后还包括对部分数据进行求和,当求和的结果大于预设值时通知指定人员的步骤。

所述步骤(2)后还包括对存储的数据进行svm分类预测的步骤。

有益效果

由于采用了上述的技术方案,本发明与现有技术相比,具有以下的优点和积极效果:本发明节约成本,方便快捷,省时省力,可以应用到需要大量统一发票信息的单位,具有很好的效果,减轻工作人员的负担。

附图说明

图1是本发明的流程图;

图2是本发明中步骤(2)的流程图;

图3是本发明中步骤(23)的流程图。

具体实施方式

下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解,在阅读了本发明讲授的内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。

本发明的实施方式涉及一种发票数据记录方法,如图1所示,包括以下步骤:

步骤(1),获取发票图像信息,将发票图像信息采集到计算机中;

步骤(2),利用matlab软件对发票图像信息进行处理,并且存储数据。其中,如图2所示,该步骤还包括以下子步骤:

(21)对得到的发票图像信息进行预处理;

(22)采用边缘提取的方式提取发票图像信息,并对发票进行定位;

(23)对定位后的发票进行字符分割和识别;其中,如图3所示,该步骤还包括以下子步骤:

(231)将采集的发票图像定位到一定的区域,方便后期对这个固定的区域提取有用的信息,将发票图像信息的文字图像区域进行分割;

(232)分离文字区域中的单个字符:应用边缘分割的方法将发票上的有用字体进行分割出来,即检测灰度级或者结构具有突变的地方,表明一个区域的终结,也是另一个区域开始的地方。这种不连续性称为边缘,不同的图像灰度不同,边界处一般有明显的边缘,利用此特征可以分割图像。

(233)对单个字符进行识别:字符的识别的主要应用技术是比对识别样本库,即将所有的字符建立样本库,字符提取后通过比对样本库实现字符的判断,识别过程中可以将产生可信度等中间结果值,给发票录入的人员作为是否应该将识别值作为录入结果的参考依据。

(24)对识别后的内容进行保存。

其中,步骤(2)后可以对部分数据进行求和,当求和的结果大于预设值时通知指定人员,还可以对存储的数据进行svm分类预测。

下面以高校的发票录入和分析工作为例阐述本发明,应该理解为,应用到其他行业或者有着类似的观点的操作视为同一个发明。

首先对发票手动添加一些内容,以高校为例,在发票面值的同一行上添加学院,比如信息,材料,人文,等等,还有发票的用处,比如资料,科研,交通等,这些文字要预先设定在matlab的图像处理识别信息库里面,供在后期识别过程中应用。然后用摄像机或者电脑上带有的摄像头拍摄发票,并且拍摄时需要将学院信息,发票用处等信息全部获取,将拍摄的图片保存为图片格式。启动matlab下设定好的GUI界面,对存贮的图像进行相应的处理,包括预处理、边缘提取、发票定位、字符分割、字符识别,其中字符识别包括正确地分割文字图像区域;正确的分离单个文字;正确识别单个字符。此刻识别出了发票的面值,学院,和用处。通过软件的程序调用识别的内容并且将其保存到指定的EXCEL或者文本文档或者.mat文件中。存储完数据后可以用软件按照学院对发票的面值求和,当某个学院的额度达到了预定值时候,可以利用matlab的通信工具箱进行发送邮件的处理操作,将发送警告到制定实现设置好的邮件。存储完数据后还可以对发票的用处进行分类操作,并且可以用svm的方法进行分类预测,并且相应的分析哪些用处占据相应多少比例,对以后制定发票的预定值具有一定的参考价值。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东华大学,未经东华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201310413333.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top