[发明专利]一种发票数据记录方法在审
申请号: | 201310413333.2 | 申请日: | 2013-09-11 |
公开(公告)号: | CN103488999A | 公开(公告)日: | 2014-01-01 |
发明(设计)人: | 安俊峰;龚涛;卢萌萌 | 申请(专利权)人: | 东华大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/60 |
代理公司: | 上海泰能知识产权代理事务所 31233 | 代理人: | 宋缨;孙健 |
地址: | 201620 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 发票 数据 记录 方法 | ||
技术领域
本发明涉及票据记录技术领域,特别是涉及一种发票数据记录和分类统计预测方法。
背景技术
发票是指一切单位和个人在购销商品、提供劳务或接受劳务、服务以及从事其他经营活动,所提供给对方的收付款的书面证明,是财务收支的法定凭证,是会计核算的原始依据,也是审计机关、税务机关执法检查的重要依据。现在各行各业用到对的发票需要报销,但是对于大型的单位发票进行录入操作非常麻烦,亟需一种方便的发票数据记录方法。
发明内容
本发明所要解决的技术问题是提供一种发票数据记录方法,节约成本,方便快捷,省时省力。
本发明解决其技术问题所采用的技术方案是:提供一种发票数据记录方法,包括以下步骤:
(1)获取发票图像信息,将发票图像信息采集到计算机中;
(2)利用matlab软件对发票图像信息进行处理,并且存储数据。
所述步骤(2)包括以下子步骤:
(21)对得到的发票图像信息进行预处理;
(22)采用边缘提取的方式提取发票图像信息,并对发票进行定位;
(23)对定位后的发票进行字符分割和识别;
(24)对识别后的内容进行保存。
所述步骤(23)包括以下子步骤:
(231)将采集的发票图像定位到一定的区域,将发票图像信息的文字图像区域进行分割;
(232)应用边缘分割的方法将发票上的有用字体进行分割出来,从而分离文字区域中的单个字符;
(233)通过比对识别样本库的方法对单个字符进行识别。
所述步骤(2)后还包括对部分数据进行求和,当求和的结果大于预设值时通知指定人员的步骤。
所述步骤(2)后还包括对存储的数据进行svm分类预测的步骤。
有益效果
由于采用了上述的技术方案,本发明与现有技术相比,具有以下的优点和积极效果:本发明节约成本,方便快捷,省时省力,可以应用到需要大量统一发票信息的单位,具有很好的效果,减轻工作人员的负担。
附图说明
图1是本发明的流程图;
图2是本发明中步骤(2)的流程图;
图3是本发明中步骤(23)的流程图。
具体实施方式
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解,在阅读了本发明讲授的内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
本发明的实施方式涉及一种发票数据记录方法,如图1所示,包括以下步骤:
步骤(1),获取发票图像信息,将发票图像信息采集到计算机中;
步骤(2),利用matlab软件对发票图像信息进行处理,并且存储数据。其中,如图2所示,该步骤还包括以下子步骤:
(21)对得到的发票图像信息进行预处理;
(22)采用边缘提取的方式提取发票图像信息,并对发票进行定位;
(23)对定位后的发票进行字符分割和识别;其中,如图3所示,该步骤还包括以下子步骤:
(231)将采集的发票图像定位到一定的区域,方便后期对这个固定的区域提取有用的信息,将发票图像信息的文字图像区域进行分割;
(232)分离文字区域中的单个字符:应用边缘分割的方法将发票上的有用字体进行分割出来,即检测灰度级或者结构具有突变的地方,表明一个区域的终结,也是另一个区域开始的地方。这种不连续性称为边缘,不同的图像灰度不同,边界处一般有明显的边缘,利用此特征可以分割图像。
(233)对单个字符进行识别:字符的识别的主要应用技术是比对识别样本库,即将所有的字符建立样本库,字符提取后通过比对样本库实现字符的判断,识别过程中可以将产生可信度等中间结果值,给发票录入的人员作为是否应该将识别值作为录入结果的参考依据。
(24)对识别后的内容进行保存。
其中,步骤(2)后可以对部分数据进行求和,当求和的结果大于预设值时通知指定人员,还可以对存储的数据进行svm分类预测。
下面以高校的发票录入和分析工作为例阐述本发明,应该理解为,应用到其他行业或者有着类似的观点的操作视为同一个发明。
首先对发票手动添加一些内容,以高校为例,在发票面值的同一行上添加学院,比如信息,材料,人文,等等,还有发票的用处,比如资料,科研,交通等,这些文字要预先设定在matlab的图像处理识别信息库里面,供在后期识别过程中应用。然后用摄像机或者电脑上带有的摄像头拍摄发票,并且拍摄时需要将学院信息,发票用处等信息全部获取,将拍摄的图片保存为图片格式。启动matlab下设定好的GUI界面,对存贮的图像进行相应的处理,包括预处理、边缘提取、发票定位、字符分割、字符识别,其中字符识别包括正确地分割文字图像区域;正确的分离单个文字;正确识别单个字符。此刻识别出了发票的面值,学院,和用处。通过软件的程序调用识别的内容并且将其保存到指定的EXCEL或者文本文档或者.mat文件中。存储完数据后可以用软件按照学院对发票的面值求和,当某个学院的额度达到了预定值时候,可以利用matlab的通信工具箱进行发送邮件的处理操作,将发送警告到制定实现设置好的邮件。存储完数据后还可以对发票的用处进行分类操作,并且可以用svm的方法进行分类预测,并且相应的分析哪些用处占据相应多少比例,对以后制定发票的预定值具有一定的参考价值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东华大学,未经东华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310413333.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于电力设备监测的图像识别方法
- 下一篇:一种识别颈部转动的方法
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置