[发明专利]基于深度学习的户型图识别方法在审
申请号: | 201711444198.2 | 申请日: | 2017-12-27 |
公开(公告)号: | CN108009598A | 公开(公告)日: | 2018-05-08 |
发明(设计)人: | 白峻峰;张文战;刘子曜;苏伟杰 | 申请(专利权)人: | 北京诸葛找房信息技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08;G06F17/30 |
代理公司: | 北京一格知识产权代理事务所(普通合伙) 11316 | 代理人: | 滑春生;赵永伟 |
地址: | 100015 北京市朝阳区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 学习 户型 识别 方法 | ||
本发明涉及一种基于深度学习的户型图识别方法,包括以下步骤:(1)训练数据的采集及预处理;(2)进行模型训练;(3)模型的使用。本发明的优点是:未使用人工标注,节约人力;模型结构简单,训练和使用都比较省时;多种只用接口可以满足不同场景需求。
技术领域
本发明涉及一种基于深度学习的户型图识别方法。
背景技术
在房产领域的户型图分类还在采用人工方式或者简单的机器辅助方式,工作效率极低,效果也是良莠不齐。
现有方式的工作效率极低,成本极高,基于人工的分类不仅费时费力,而且很难保证质量,也很难对质量进行评测和监控,不能适应海量数据的处理,很难面对大数据时代的挑战。
发明内容
为克服现有技术的缺陷,本发明提供一种基于深度学习的户型图识别方法,本发明的技术方案是:
基于深度学习的户型图识别方法,包括以下步骤:
(1)训练数据的采集及预处理;
(2)进行模型训练;
(3)模型的使用。
所述的步骤(1)具体为:
(1-1)利用网络爬虫采集了多个房产官网的房源图片信息,结合采集页面的规则以及发现数据源特点,根据房产官网的标记信息为图片标记标签,具体获取标签方法如下:
a、找到标记该图片标签的兄弟标签,发现是否有标识该图片属性的标签,如果有则进行获取;
b、解析图片的URL,检测是否包含能标识图片类型的标签,如果有则进行获取;
(1-2)对采集的数据进行预处理:
a、将采集的图片缩放成短边100px的图片;
b、然后随机切割成100 pxX 100px的图片作为训练样本;
c、使用数据增强方法,对图片进行角度旋转,对每个图片,以图片中心点为中心分别逆时针旋转90度、180度和270度;
所述的步骤(2)具体为:
(2-1)使用pytorch深度学习框架训练,模型的方法使用的CNN卷积神经网络,网络共分8层,分别为第一层卷积层,第二层卷积层,第三层池化层,第四层卷积层,第五层卷积层,第六层池化层,第七层全联接层,第八层全联接层,第七层以及第八层的全联接层以及标签通过交叉熵损失函数计算损失进行反向传播,通过rmsprop优化方法调整学习率,调整参数,共训练30个epoch。
所述的步骤(3)具体为:基于flask框架提供api接口,提前预加载步骤(2)的模型,具体步骤如下:
(4-1)在flask文件入口处添加模型的加载函数,
(4-2)读取步骤(2)中训练好了模型参数,
(4-3)搭建同步骤(2)中训练好的模型参数的网络,并读取的模型参数初始化网,这样就复现了步骤(2)训练的模型,
(4-4)保存此模型在内存中让模型常驻内存。
所述的步骤(3)具体为:进行离线批量处理,具体步骤如下:
(5-1)提供了快速下载图片接口,批量下载大量图片,
(5-2)模型本身提供batch使用接口,每次读取batch个数据进入模型然后批量使用算法处理,速度为2~3张/秒。
本发明的优点是:未使用人工标注,节约人力;模型结构简单,训练和使用都比较省时;多种只用接口可以满足不同场景需求。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京诸葛找房信息技术有限公司,未经北京诸葛找房信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711444198.2/2.html,转载请声明来源钻瓜专利网。