[发明专利]一种解析房产证照片内容的方法有效
申请号: | 201711305635.2 | 申请日: | 2017-12-11 |
公开(公告)号: | CN108038504B | 公开(公告)日: | 2019-12-27 |
发明(设计)人: | 俞中宏;张佳敏;蔡立俊;曾智磊;张德恩 | 申请(专利权)人: | 深圳房讯通信息技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/34;G06K9/46 |
代理公司: | 11574 北京律远专利代理事务所(普通合伙) | 代理人: | 丁清鹏 |
地址: | 518000 广东省深圳市南山区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 解析 房产证 照片 内容 方法 | ||
1.一种解析房产证照片内容的方法,其特征在于,所述的解析房产证照片内容的方法包括以下步骤:
1)对不同版本房产证照片进行采集,在数据库建立不同版本房产证模板
对不同版本的房产证做了识别的标签-“模板”,房产证模板是一个Json数据,里面记录了房产证的标准宽度,以及每个信息字段的名称、位置和宽高;
2)拍摄待识别房产证照片,识别字段区域,计算模板匹配度,选取最高匹配度的版本作为待识别的房产证的版本;
a.识别字段区域,利用房产证边框自动查找技术识别字段区域,具体步骤为:
(1)利用Opencv中自适应二值化算法将图片从彩色、灰色照片转换为黑白两色图片;
(2)利用Opencv中FindContours算法获取图片上所有的轮廓的轮廓集合,枚举所有的点,计算任意两个点的长度,找出最长的长度对应的两个点,记作点1、点2;然后再枚举剩余的点,与点1点2行成的三角形,找出三角形周长最大的点,记作点3;然后再次枚举剩余的点,找出与点3距离最长的点,记作点4,点1、点2、点3、点4构成缩减后的轮廓;
(3)筛选出正确的轮廓;剔除凹四边形的轮廓,选择凸四边形轮廓,并在四边形的每个边取5个点,共20个点进行底色验证;
根据模板中获取每个信息字段的坐标、宽高,得到该字段区域的四个顶点及四条边上的中点;
b.使用8点验证法对模板的每个字段进行验证,确定有效模板信息字段的数量;
c.计算模板匹配度,模板匹配度=有效模板信息字段数/模板信息字段数,得到最高匹配度的版本模板,具体步骤为:
对模板的每个字段进行验证,并计算模板匹配度,得出房产证版本信息;模板匹配度=有效模板信息字段数/模板信息字段数;模板信息字段指的是对应版本房产证中所包含的信息数;每个信息字段都进行8点验证,通过8点验证的,这个信息字段算作有效模板信息字段;8点验证法:是根据模板中取得每个信息字段的坐标、宽高,得到该字段区域的四个顶点及四条边上的中点,共8个点,确定8个点中某个点的坐标,验证以这个点的坐标,半径为10的范围内的点是否有白点;只要这个半径范围内有白点就验证通过;
3)对每个字段进行分割,通过图像识别技术对字段进行识别,得到图片里面的内容;获取到了房产证图片所属的版本,为了获取该版本房产证中的每个字段信息,将房产证图片,按照模板进行切割,得到每个内容字段所对应的字段图;然后通过OCR识别得出字段图里面的文字信息,再通过卷积神经网络算法识别出字段图内的数字信息;然后对各个字段图所识别出的内容进行汇总,得出房产证照片的所有准确信息;
卷积神经网络算法主要用三种结构实现对输入的局部平移不变性:局部接收域、权值共享和次子样;在卷积层中,前一层的特征图被一个可学习的卷积核进行卷积,再通过一个激活函数,既可以得到这一层的输出特征图;卷积的形式如式(1)所示:
1代表卷积神经网络结构层数,K是卷积核,Mj表示的是输入特征图的集合,代表特征图的选择,b表示每个输出图的偏置值;
在子采样层中,如果有N个输入特征图,就有N个输出特征图,只是每个输出特征图都变小了;子采样层的形式如公式(2)所示:
down(.)表示一个子采样函数,是对输入图像的一个n*n大小的区域求和;这样输出图像在两个维度上都缩小了n倍;每个输出特征图都对一个乘性偏置β和一个加性偏置b;
卷积网络在本质上是一种输入到输出的映射,它能够学习大量的输入与输出之间的映射关系,而不需要任何输入和输出之间的精确数学表达式;训练算法分为两个阶段,第一阶段,向前传播阶段:d.从样本集中取一个样本(X,YP),将X输入网络;e.计算相应的实际输出Op为公式(3)所示:
Op=Fn(...(F2(F1(XpW(1) W(2))...)W(n))) (3)
第二阶段向后传播阶段:f.计算实际输出Op与相应的理想输出YP的差;g.按极小化误差的方法反向传播调整权矩阵;
通过在线自动生成0-9序列号的工具,生成1000组数据,将这些图片上的字符归一化为48*48大小,用600组作为训练集,400组作为测试集,对卷积网络进行训练。
2.根据权利要求1所述的一种解析房产证照片内容的方法在房产证信息识别中的应用。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳房讯通信息技术有限公司,未经深圳房讯通信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711305635.2/1.html,转载请声明来源钻瓜专利网。
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法