[发明专利]一种提取含有二维码的营业执照信息的方法及装置在审
申请号: | 201910053523.5 | 申请日: | 2019-01-21 |
公开(公告)号: | CN109815765A | 公开(公告)日: | 2019-05-28 |
发明(设计)人: | 俞菲;潘迪;张旭帆;曹钊铭;周宇;徐琴珍;杨绿溪 | 申请(专利权)人: | 东南大学 |
主分类号: | G06K7/14 | 分类号: | G06K7/14;G06N3/04 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 柏尚春 |
地址: | 211102 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 二维码 统一资源定位符 预处理 抓取 企业信用信息 网页页面信息 样本处理模块 二维码识别 二维码图像 图像 办公效率 定位模块 定位模型 基本信息 目标检测 图片背景 网络训练 网页信息 准确度 图像集 准确率 网站 扫描 检测 学习 | ||
1.一种提取含有二维码的营业执照信息的方法,其特征在于,包括步骤:
(1)获取含有二维码的营业执照图像作为样本,通过图片预处理扩充样本数量,制作数据集;
(2)根据基于深度学习的检测方法训练所述数据集,获得二维码定位模型;
(3)根据所述二维码定位模型对待检测含二维码的营业执照图像进行二维码定位,获得二维码图像;
(4)扫描所述二维码图像,提取所述二维码包含的企业信用信息网站统一资源定位符;
(5)根据所述统一资源定位符对应的网页页面信息,抓取所述营业执照的基本信息。
2.根据权利要求1所述的方法,其特征在于:步骤(1)中,所述图片预处理包括:对营业执照图像分别进行镜像翻转,旋转,添加高斯噪声。
3.根据权利要求1所述的方法,其特征在于,步骤(1)中,所述制作数据集包括:
(1.1)读取所述预处理后含有二维码的营业执照图像;
(1.2)在所述营业执照图像中标记出二维码所在区域并标注为“qr”类别;
(1.3)将二维码所在区域在所述图像中所处的位置信息及标注的类别信息存入可读取文件中,每一张图像对应一个文件;
(1.4)将所述可读取文件以7:3的比例分为训练集和测试集,训练集和测试集之间无交集。
4.根据权利要求1所述的方法,其特征在于,步骤(2)中,所述基于深度学习的检测方法包括:基于TensorFlow框架的超快速基于候选区域的卷积神经网络。
5.根据权利要求1所述的方法,其特征在于,步骤(4)中,所述扫描的二维码图像包括:利用开源软件包扫描所提取的二维码图像。
6.根据权利要求1所述的方法,其特征在于,所述步骤(5)包括:
(5.1)访问所述统一资源定位符,获取所述对应的网页页面信息;
(5.2)对所述网页页面信息进行JSON解析,抓取出所述网页页面信息中营业执照的基本信息,包括统一社会信用代码,注册号,名称,类型,经营者,组成形式,注册日期,经营场所,经营范围,登记状态。
7.一种提取含有二维码的营业执照信息的装置,其特征在于,包括:
样本处理模块,用于获取含有二维码的营业执照图像作为样本,通过图片预处理扩充样本数量,制作数据集;
二维码定位模块,用于根据基于深度学习的检测方法训练所述数据集,获得二维码定位模型,采用所述二维码定位模型对待检测含二维码的营业执照图像进行二维码定位,获得二维码图像;
二维码识别模块,用于扫描所述二维码图像,提取所述二维码包含的企业信用信息网站统一资源定位符;
网页信息抓取模块,用于根据所述统一资源定位符对应的网页页面信息,抓取所述营业执照的基本信息。
8.根据权利要求7所述的装置,其特征在于,所述样本处理模块包括:
样本扩充模块,用于对批量获取的营业执照图像分别进行镜像翻转,旋转,添加高斯噪声,增加样本数量;
数据集制作模块,用于读取所述含有二维码的营业执照图像,在所述营业执照图像中标记出二维码所在区域并标注为“qr”类别;将二维码所在区域在所述图像中所处的位置信息及标注类别信息存入可读取文件中,每一张图像对应一个文件;将所述可读取文件以7:3的比例分为训练集和测试集,训练集和测试集之间无交集。
9.根据权利要求7所述的装置,其特征在于:所述基于深度学习的检测方法包括基于TensorFlow框架的超快速基于候选区域的卷积神经网络。
10.根据权利要求7所述的装置,其特征在于,所述网页信息抓取模块包括:
获取网页信息模块,用于访问所述统一资源定位符,获取所述对应的网页页面信息;
解析模块,用于对所述网页页面信息进行JSON解析,抓取出所述网页页面信息中营业执照的基本信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910053523.5/1.html,转载请声明来源钻瓜专利网。