[发明专利]一种解析房产证照片内容的方法有效

专利信息
申请号: 201711305635.2 申请日: 2017-12-11
公开(公告)号: CN108038504B 公开(公告)日: 2019-12-27
发明(设计)人: 俞中宏;张佳敏;蔡立俊;曾智磊;张德恩 申请(专利权)人: 深圳房讯通信息技术有限公司
主分类号: G06K9/62 分类号: G06K9/62;G06K9/34;G06K9/46
代理公司: 11574 北京律远专利代理事务所(普通合伙) 代理人: 丁清鹏
地址: 518000 广东省深圳市南山区*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 解析 房产证 照片 内容 方法
【权利要求书】:

1.一种解析房产证照片内容的方法,其特征在于,所述的解析房产证照片内容的方法包括以下步骤:

1)对不同版本房产证照片进行采集,在数据库建立不同版本房产证模板

对不同版本的房产证做了识别的标签-“模板”,房产证模板是一个Json数据,里面记录了房产证的标准宽度,以及每个信息字段的名称、位置和宽高;

2)拍摄待识别房产证照片,识别字段区域,计算模板匹配度,选取最高匹配度的版本作为待识别的房产证的版本;

a.识别字段区域,利用房产证边框自动查找技术识别字段区域,具体步骤为:

(1)利用Opencv中自适应二值化算法将图片从彩色、灰色照片转换为黑白两色图片;

(2)利用Opencv中FindContours算法获取图片上所有的轮廓的轮廓集合,枚举所有的点,计算任意两个点的长度,找出最长的长度对应的两个点,记作点1、点2;然后再枚举剩余的点,与点1点2行成的三角形,找出三角形周长最大的点,记作点3;然后再次枚举剩余的点,找出与点3距离最长的点,记作点4,点1、点2、点3、点4构成缩减后的轮廓;

(3)筛选出正确的轮廓;剔除凹四边形的轮廓,选择凸四边形轮廓,并在四边形的每个边取5个点,共20个点进行底色验证;

根据模板中获取每个信息字段的坐标、宽高,得到该字段区域的四个顶点及四条边上的中点;

b.使用8点验证法对模板的每个字段进行验证,确定有效模板信息字段的数量;

c.计算模板匹配度,模板匹配度=有效模板信息字段数/模板信息字段数,得到最高匹配度的版本模板,具体步骤为:

对模板的每个字段进行验证,并计算模板匹配度,得出房产证版本信息;模板匹配度=有效模板信息字段数/模板信息字段数;模板信息字段指的是对应版本房产证中所包含的信息数;每个信息字段都进行8点验证,通过8点验证的,这个信息字段算作有效模板信息字段;8点验证法:是根据模板中取得每个信息字段的坐标、宽高,得到该字段区域的四个顶点及四条边上的中点,共8个点,确定8个点中某个点的坐标,验证以这个点的坐标,半径为10的范围内的点是否有白点;只要这个半径范围内有白点就验证通过;

3)对每个字段进行分割,通过图像识别技术对字段进行识别,得到图片里面的内容;获取到了房产证图片所属的版本,为了获取该版本房产证中的每个字段信息,将房产证图片,按照模板进行切割,得到每个内容字段所对应的字段图;然后通过OCR识别得出字段图里面的文字信息,再通过卷积神经网络算法识别出字段图内的数字信息;然后对各个字段图所识别出的内容进行汇总,得出房产证照片的所有准确信息;

卷积神经网络算法主要用三种结构实现对输入的局部平移不变性:局部接收域、权值共享和次子样;在卷积层中,前一层的特征图被一个可学习的卷积核进行卷积,再通过一个激活函数,既可以得到这一层的输出特征图;卷积的形式如式(1)所示:

1代表卷积神经网络结构层数,K是卷积核,Mj表示的是输入特征图的集合,代表特征图的选择,b表示每个输出图的偏置值;

在子采样层中,如果有N个输入特征图,就有N个输出特征图,只是每个输出特征图都变小了;子采样层的形式如公式(2)所示:

down(.)表示一个子采样函数,是对输入图像的一个n*n大小的区域求和;这样输出图像在两个维度上都缩小了n倍;每个输出特征图都对一个乘性偏置β和一个加性偏置b;

卷积网络在本质上是一种输入到输出的映射,它能够学习大量的输入与输出之间的映射关系,而不需要任何输入和输出之间的精确数学表达式;训练算法分为两个阶段,第一阶段,向前传播阶段:d.从样本集中取一个样本(X,YP),将X输入网络;e.计算相应的实际输出Op为公式(3)所示:

Op=Fn(...(F2(F1(XpW(1) W(2))...)W(n))) (3)

第二阶段向后传播阶段:f.计算实际输出Op与相应的理想输出YP的差;g.按极小化误差的方法反向传播调整权矩阵;

通过在线自动生成0-9序列号的工具,生成1000组数据,将这些图片上的字符归一化为48*48大小,用600组作为训练集,400组作为测试集,对卷积网络进行训练。

2.根据权利要求1所述的一种解析房产证照片内容的方法在房产证信息识别中的应用。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳房讯通信息技术有限公司,未经深圳房讯通信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711305635.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top