[发明专利]一种基于经纬度的闭合园区去重方法在审
申请号: | 202211345186.5 | 申请日: | 2022-10-31 |
公开(公告)号: | CN115563096A | 公开(公告)日: | 2023-01-03 |
发明(设计)人: | 唐杰;徐敏;徐超;陈雨鑫 | 申请(专利权)人: | 浙江有数数智科技有限公司 |
主分类号: | G06F16/215 | 分类号: | G06F16/215;G06F16/29;G06F18/22;G06F18/241 |
代理公司: | 北京崇智知识产权代理有限公司 11605 | 代理人: | 吕玉博 |
地址: | 310000 浙江省杭州市上城*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 经纬度 闭合 园区去重 方法 | ||
1.一种基于经纬度的闭合园区去重方法,其特征在于,包括以下步骤:
获取目标园区的名称、定位点经纬度,边界经纬度、地址以及所属省市区县;
通过向量积计算所述目标园区面积;
基于所述目标园区所属省市区县、园区名称及园区地址将所述目标园区分为三类数据,按照数据类型对所述三类数据进行分组;
通过预先建立的重叠面积识别模型计算所述三类数据中各组园区之间的重叠面积;
根据园区名称相似度及园区之间重叠面积比值设定重复园区剔除规则,确定所述三类数据中各组需要剔除的重复园区。
2.如权利要求1所述的基于经纬度的闭合园区去重方法,其特征在于,所述2的、重叠面积识别模型建立方法包括:首先获取所述目标园区边界经纬度的最大值和最小值,根据所述目标园区边界经度的最大值和最小值计算边界经度最大距离,根据所述目标园区边界纬度的最大值和最小值计算边界纬度最大距离;然后取边界经度最大距离和边界纬度最大距离中的较小值,根据取出的最小值给定geohash位数;再按照给定位数的geohash对所述目标园区边界经纬度围成的闭合区域进行切割,计算在给定geohash位数下,所述三类数据各组园区中任意两个园区重合的切割网格个数,最后根据重叠面积计算公式得到各组园区中任意两个园区之间的重叠面积,重叠面积计算公式为
Soverlap(A1,A2)=N(A1,A2)×Sn
其中,A1和A2表示各组园区中任意两个园区,Soverlap(A1,A2)表示园区A1和园区A2的重叠面积,N(A1,A2)表示园区A1和园区A2重合的切割网格个数,Sn表示给定的geohash位数下单个切割网格的覆盖面积。
3.如权利要求1所述的基于经纬度的闭合园区去重方法,其特征在于,所述基于所述目标园区所属省市区县、园区名称及园区地址将所述目标园区分为三类数据,按照数据类型对所述三类数据进行分组,包括:园区名称相同且所属省市区县相同为第一分类,所述第一分类下园区按照园区名称分组;园区地址相同但园区名称不同为第二分类,所述第二分类下园区按照园区地址分组;园区名称和地址均不相同为第三分类,所述第三分类下园区按照园区名称、园区所属省市区县及园区之间距离小于距离阈值L分组。
4.如权利要求1所述的基于经纬度的闭合园区去重方法,其特征在于,所述根据园区名称相似度及园区之间重叠面积比值设定重复园区剔除规则,确定所述三类数据中各组需要剔除的重复园区,包括:
所述园区名称相似度和所述园区之间重叠面积比值计算公式分别为
其中,A1和A2表示各组园区中任意两个园区,similarity(A1,A2)表示园区A1和园区A2的名称相似度,length(A1∩A2)表示园区A1和园区A2名称中相同的字符个数,length(Ai)(i=1,2)表示园区Ai名称中出现的字符个数,表示已经通过向量积计算出的园区Ai的面积,表示园区A1和园区A2中面积较大值,表示园区A1和园区A2中面积较小值,Soverlap(A1,A2)表示已经通过所述重叠面积识别模型计算出的园区A1和园区A2的重叠面积。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江有数数智科技有限公司,未经浙江有数数智科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211345186.5/1.html,转载请声明来源钻瓜专利网。