[发明专利]基于插件的发票识别方法有效
申请号: | 201710506334.X | 申请日: | 2017-06-28 |
公开(公告)号: | CN107358232B | 公开(公告)日: | 2020-12-29 |
发明(设计)人: | 衣杨;赵小蕾;王玉娟;石晓红 | 申请(专利权)人: | 中山大学新华学院 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/34 |
代理公司: | 广州汇航专利代理事务所(普通合伙) 44537 | 代理人: | 吕诗 |
地址: | 510520 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 插件 发票 识别 方法 | ||
本发明公开了一种基于插件的发票识别方法、及识别与管理系统;其中,识别方法包括:将预先创建的识别插件导入到动态链接库中;其中,识别插件基于适应于对应类型的发票的识别算法创建;获取待识别的发票的图像信息,及其类型;根据该待识别的发票的类型从动态链接库中调取对应的识别插件以对该待识别的发票的图像信息进行识别,进而获取所需的发票信息。本发明的优点是:1、员工能够自行录入发票信息,把发票信息提交到后台,供财务人员处理,从而减少财务人员的负担;2、每当有新类型的发票出现时,可以动态地向系统中添加针对该类型发票的识别算法,使系统能够识别新类型的发票,从工程角度解决多种发票识别问题。
技术领域
本发明涉及一种图像识别技术,更具体地说,它涉及一种基于插件的发票识别方法、及识别与管理系统。
背景技术
在国外,许多公司致力于OCR的研究有许多研究,如美国AcuForm、俄罗斯ABBYY、法国A2iA等,其产品主要应用于会计业务、印刷业务等。俄罗斯ABBYY公司开发了一款专业OCR软件ABBYY FineReader Professional。FineReader软件不仅支持多种语言的识别,同时能对彩色文件进行识别,还有存在许多其他强大的功能。A2iA公司设计了一款支票识别软件,该软件不仅处理支票速度快而且识别率高[4]。随着对OCR系统深入的研究,其产品也是应用在很多领域。
国外有众多开源的OCR引擎,如Tesseract、Cuneiform、OCRopus等。 Tesseract早期是由惠普开发的OCR库,后来由谷歌负责对其进行优化等工作。OCRopus是一款免费的文档分析和光学字符识别系统,它通过使用插件允许OCRopus轻松地更换组件,在Apache许可证版本2.0下进行了非常模块化的设计。这些开源的OCR引擎的发展,也使得票据识别有了快速的发展。
在国内,票据识别系统研究始于1988年。随着票据识别技术不断的成熟票据识别被广泛用于各个行业。国内有许多票据识别公司,如汉王科技、云脉、文通、汉特等,其OCR产品具有强大的功能,不仅速度而且识别率高,还有针对某些特定行业的定制应用产品。汉王公司有许多OCR产品如名片识别、身份证识别、PDF与JPG格式文件识别等都有很高的识别率。
针对发票识别与管理系统,目前还处于根据发票模板定制阶段,如云脉、汉王等公司提供增值税发票等发票识别业务。汉特、金蝶和用友等公司专为公司提供财务软件,但公司的财务软件中仅仅是发票管理,或者仅仅提供一种定制的发票识别系统,系统可扩展性不强。
综上所述,目前越来越多的公司投入到票据识别与管理系统当中,取得很多不错的成果,但也存在许多不足。票据种类繁多,有些票据的识别已经达到商用的要求,但有些票据版面的识别还存在许多问题。对于票据识别与管理系统各大公司缺少一个系统化的方案,这方面还需要继续研究。
发明内容
针对现有技术存在的不足,本发明的第一个目的在于提供一种基于插件的发票识别方法,能够对多种不同类型的发票进行识别。
为实现上述目的,本发明提供了如下技术方案:
一种基于插件的发票识别方法,包括:
将预先创建的识别插件导入到动态链接库中;其中,所述识别插件基于适应于对应类型的发票的识别算法创建;
获取待识别的发票的图像信息,及其类型;
根据该待识别的发票的类型从所述动态链接库中调取对应的识别插件以对该待识别的发票的图像信息进行识别,进而获取所需的发票信息。
优选地,所述方法还包括:
将获取到的发票信息存入到数据库中。
优选地,所述识别算法包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学新华学院,未经中山大学新华学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710506334.X/2.html,转载请声明来源钻瓜专利网。