[发明专利]一种相似房源数据检测方法、装置及终端设备在审
申请号: | 201910055282.8 | 申请日: | 2019-01-21 |
公开(公告)号: | CN109948644A | 公开(公告)日: | 2019-06-28 |
发明(设计)人: | 王灵山 | 申请(专利权)人: | 深圳壹账通智能科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q50/16 |
代理公司: | 深圳中一专利商标事务所 44237 | 代理人: | 高星 |
地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图片 数据检测 终端设备 数据处理技术 图片相似度 相似度检测 正整数 检测 保证 | ||
本发明提供了一种相似房源数据检测方法、装置及终端设备,适用于数据处理技术领域,该方法包括:获取第一房源数据中包含的N张第一图片,以及第二房源数据中包含的M张第二图片,其中,N和M均为正整数;对N张第一图片和M张第二图片进行相似度检测,得到第一房源数据与第二房源数据中包含的相似图片的数量;基于相似图片的数量,判断第一房源数据与第二房源数据是否为相似房源数据。本发明实施例保证了最终对两张图片相似度检测的准确性,实现对相似图片的精确识别。
技术领域
本发明属于数据处理技术领域,尤其涉及相似房源数据检测方法及终端设备。
背景技术
现在进行卖房租房信息展示的房源平台管理方式较为松散,房东和中介可自由上传房源图片至平台,但实际应用中发现由于房东和中介可能会对一个房源重复发帖,从而使得房源平台中充斥着大量重复、相似的图片,这严重导致了平台存储资源的浪费,同时使得用户无法正常使用平台进行房源信息查阅。因此,现有技术中急需一种可以进行相似房源数据识别的方法,以帮助房源平台对检测出相同房源的房源数据进行管理,提升平台的管理效率。
发明内容
有鉴于此,本发明实施例提供了一种相似房源数据检测方法及终端设备,以解决现有技术中房源平台重复房源数据过多,无法识别相似房源数据的问题。
本发明实施例的第一方面提供了一种相似房源数据检测方法,包括:
获取第一房源数据中包含的N张第一图片,以及第二房源数据中包含的M张第二图片,其中,N和M均为正整数;
对所述N张第一图片和所述M张第二图片进行相似度检测,得到所述第一房源数据与所述第二房源数据中包含的相似图片的数量;
基于所述相似图片的数量,判断所述第一房源数据与所述第二房源数据是否为相似房源数据;
所述对所述N张第一图片和所述M张第二图片进行相似度检测,包括:
提取第一图片中包含的第一特征点,筛选出其中的边缘特征点,并基于该边缘特征点进行连线得到对应的第一多边形;
基于所述第一多边形内包含的图片内容,对第二图片进行图片区域匹配,筛选出在所述第二图片中对应的第一图片区域;
提取所述第一图片区域中包含的第二特征点,筛选出其中的边缘特征点,并基于该边缘特征点进行连线得到对应的第二多边形;
计算所述第一多边形内包含的图片内容,与所述第一图片区域的第一相似度,并计算所述第一多边形与所述第二多边形的第二相似度;
若所述第一相似度和所述第二相似度均大于对应的预设阈值,判定所述第一图片与所述第二图片为相似图片。
本发明实施例的第二方面提供了一种相似房源数据检测装置,包括:
图片获取模块,用于获取第一房源数据中包含的N张第一图片,以及第二房源数据中包含的M张第二图片,其中,N和M均为正整数;
相似图片检测模块,用于对所述N张第一图片和所述M张第二图片进行相似度检测,得到所述第一房源数据与所述第二房源数据中包含的相似图片的数量;
相似房源判定模块,用于基于所述相似图片的数量,判断所述第一房源数据与所述第二房源数据是否为相似房源数据;
相似图片检测模块,包括:
第一多边形提取模块,用于提取第一图片中包含的第一特征点,筛选出其中的边缘特征点,并基于该边缘特征点进行连线得到对应的第一多边形;
第一图片区域筛选模块,用于基于所述第一多边形内包含的图片内容,对第二图片进行图片区域匹配,筛选出在所述第二图片中对应的第一图片区域;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳壹账通智能科技有限公司,未经深圳壹账通智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910055282.8/2.html,转载请声明来源钻瓜专利网。