[发明专利]一种提取含有二维码的营业执照信息的方法及装置在审
申请号: | 201910053523.5 | 申请日: | 2019-01-21 |
公开(公告)号: | CN109815765A | 公开(公告)日: | 2019-05-28 |
发明(设计)人: | 俞菲;潘迪;张旭帆;曹钊铭;周宇;徐琴珍;杨绿溪 | 申请(专利权)人: | 东南大学 |
主分类号: | G06K7/14 | 分类号: | G06K7/14;G06N3/04 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 柏尚春 |
地址: | 211102 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 二维码 统一资源定位符 预处理 抓取 企业信用信息 网页页面信息 样本处理模块 二维码识别 二维码图像 图像 办公效率 定位模块 定位模型 基本信息 目标检测 图片背景 网络训练 网页信息 准确度 图像集 准确率 网站 扫描 检测 学习 | ||
本发明公开了一种提取含有二维码的营业执照信息的方法及装置。其中,方法包括:对获取的含有二维码的营业执照图像进行预处理,并基于深度学习的目标检测网络训练预处理后的图像集,获得二维码定位模型;对待检测含二维码的营业执照图像进行二维码定位;获得并扫描二维码图像,提取所述二维码包含的企业信用信息网站统一资源定位符;根据所述统一资源定位符对应的网页页面信息,抓取所述营业执照的基本信息。装置包括样本处理模块、二维码定位模块、二维码识别模块及网页信息抓取模块。本发明提高了二维码定位的准确度,克服了图片背景复杂导致二维码定位不准确的问题,实现100%准确率提取营业执照信息,提高了办公效率。
技术领域
本发明涉及一种二维码信息提取方法及装置,属于深度学习、计算机视觉领域,尤其涉及一种提取含有二维码的营业执照信息的方法及装置。
背景技术
营业执照是工商行政管理机关发给工商企业、个体经营者的准许从事某项生产经营活动的凭证。为防止不法商铺伪造营业执照或在营业执照有效期到期之后不及时申请新的营业执照,国家公务人员需要定期检查备案工商企业、个体经营者的营业执照信息,包括统一社会信用代码,注册号,名称,类型,经营者,组成形式,注册日期,经营场所,经营范围,登记状态等。
传统营业执照的信息采集都是通过移动终端设备拍摄营业执照图像,再由专人对这些图像上的营业执照信息进行人工核实、备案,费时费力。
光学字符识别(Optical Character Recognition,OCR)技术也被用来提取营业执照图片上的文字信息。然而,该技术所试用的对象是背景单一、字体固定的扫描文本图片,而营业执照图片的获取途径一般都是由相机拍摄,光照,角度以及营业执照本身的防伪花纹都会降低字符识别的准确率。
从2014年开始,工商行政管理局颁发了含有防伪二维码的新版营业执照。扫描该二维码即可进入国家企业信用信息公示系统,上面就显示了该营业执照的详细信息,包括注册号,名称,类型,注册日期,核准日期等等。市民可以通过扫描该二维码得到该商户的具体信息以判断该商户的经营是否合法,而国家公务人员则可以通过扫描二维码得到营业执照信息以定期更新备案。
普通的二维码解码设备都要求二维码占输入图片面积的80%以上,且二维码要足够清晰才能够确保二维码能被识别解码。但是,商户的营业执照往往挂在墙上或者放置在展示柜中,近距离的扫描会造成极大的不方便。一般来说,二维码都打印在营业执照的左下角并且只占了营业执照的很小一部分面积,如果将移动终端拍摄的营业执照图像直接输入二维码解码设备往往会导致二维码解码失败。所以将移动终端拍摄的营业执照图像上的二维码准确的定位并截取出来,这对后续二维码识别解码至关重要。
一方面,传统的二维码定位方式是基于连通域的定位,即通过将输入图片灰度化,二值化,闭运算后,将连通域面积最大的部分截取出来。这种二维码定位方法对于图片背景、光照非常敏感。另一方面,营业执照上的国徽或密集的文字在闭运算后也能生成大面积的连通域,这就会导致最后定位的结果不是二维码,使定位精度降低。人们更希望扫描之后能看到清晰明了的实用文字信息,国家公务人员也更希望扫描之后可以得到可编辑的文字信息,这样更新备案商户信息的时候会更加省时省力。
发明内容
发明目的:本发明提供一种提取营业执照信息的方法,通过基于深度学习的目标检测网络对移动终端拍摄的营业执照图象上的二维码进行定位、截取、解码,提高信息提取的准确度和效率。
本发明的另一目的是提供一种基于上述方法的装置。
技术方案:本发明所述的一种提取含有二维码的营业执照信息的方法,包括步骤:
(1.1)获取预处理后含有二维码的营业执照图像作为样本,通过图片预处理扩充样本数量;
进一步地,所述图片预处理包括:对批量获取的营业执照图像分别进行镜像翻转,旋转,添加高斯噪声;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910053523.5/2.html,转载请声明来源钻瓜专利网。