[发明专利]地点区域确定方法和装置无效
申请号: | 200810105995.2 | 申请日: | 2008-05-07 |
公开(公告)号: | CN101576892A | 公开(公告)日: | 2009-11-11 |
发明(设计)人: | 周利民;段剑波;刁文波;唐文 | 申请(专利权)人: | 爱帮聚信(北京)科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京同立钧成知识产权代理有限公司 | 代理人: | 吴新银 |
地址: | 100083北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 地点 区域 确定 方法 装置 | ||
1、一种地点区域确定方法,其特征在于包括:
根据获取的地址词及关键词在地址数据库中匹配出商户的地址数据;
当检验所述商户的地址数据被引用的次数大于第一阈值时,根据所述地址数据中的最大坐标值和最小坐标值确定一个几何图形,对所述几何图形进行分块,并根据所述块之间的距离对所述块进行聚类;若检验所述商户的地址数据被引用的次数不大于第一阈值,则将该商户的地址数据输出到错误记录文件,并结束操作;
根据每个聚类结果所包括的地址数据的数量,对所述聚类结果进行降序排列;
计算每个聚类结果的中心和半径,并删除与第一聚类结果的距离大于第二阈值的聚类结果;
输出所述聚类结果。
2、根据权利要求1所述的地点区域确定方法,其特征在于所述几何图形为矩形。
3、根据权利要求2所述的地点区域确定方法,其特征在于根据获取的地址词及关键词在地址数据库中匹配出商户的地址数据具体为根据获取的地址词及关键词在地址数据库中按照地址最大匹配的方式匹配出商户的地址数据。
4、根据权利要求3所述的地点区域确定方法,其特征在于在检验所述商户的地址数据被引用的次数大于第一阈值前还包括:
将所述根据获取的地址词及关键词匹配出的商户的地址数据与所述地址词的地址同义词匹配出的商户的地址数据合并;
删除提取出的商户的地址数据中不能定位及定位后与城市中心点距离大于第三阈值的地址数据。
5、根据权利要求4所述的地点区域确定方法,其特征在于所述根据所述块之间的距离对所述块进行聚类具体为:
根据所述匹配出的商户的地址数据的最大坐标值与最小坐标值确定一个矩形覆盖所有的商户的地址数据;
将所述矩形进行分块,每块边长为第四阈值;
统计每块的商户的地址数据的数量并根据各块的商户的地址数据的数量对各块进降序排列;
从排序后的各块中选取前n个块,该前n个块覆盖的商户的地址数据的数量超过商户的地址数据总数的比例值为第五阈值;
将该前n个块进行聚类。
6、根据权利要求5所述的地点区域确定方法,其特征在于,所述将该前n个块进行聚类具体为:如果两块之间的距离不大于第六阈值,则将该两块归入同一个聚类结果。
7、根据权利要求6所述的地点区域确定方法,其特征在于,所述输出所述聚类结果之前还包括:
检验所述聚类结果的半径是否大于第七阈值,且所述聚类结果覆盖的商户的地址数据的比例是否大于第八阈值,若是,则对所述聚类结果进行精度提升,若否,则执行所述输出各聚类的聚类结果的操作。
8、根据权利要求7所述的地点区域确定方法,其特征在于,所述对所述聚类结果进行精度提升具体为:
遍历所述聚类结果的覆盖区域的所有边界;
从所述聚类结果的覆盖区域的所有边界中挑选出可被移除的最大矩形,该矩形覆盖的商户数量为0;
将该矩形添加到移除列表中,并设置该矩形内的各块为不可移除状态;
检验是否达到预先设定的矩形移除数量,所述矩形移除数量为第九阈值,若达到则结束操作,若未达到,则重新遍历边界,挑选可被移除的最大矩形。
9、根据权利要求8所述的地点区域确定方法,其特征在于:所述聚类结果包括该聚类中的商户的地址数据的数量、所述商户的地址数据的数量占总的商户的地址数据数量的比例、聚类结果的半径、聚类结果的中心及应该移除的区域。
10、根据权利要求9所述的地点区域确定方法,其特征在于,在所述输出各聚类的聚类结果之后还包括:若所述地址词的第一聚类结果的半径大于第七阈值,则将所述地址词及聚类结果输出到大地点数据文件中。
11、一种地点区域确定装置,其特征在于包括:
匹配模块,用于根据获取的地址词及关键词在地址数据库中匹配出商户的地址数据;
聚类模块,用于当检验所述商户的地址数据被引用的次数大于第一阈值时,根据所述地址数据中的最大坐标值和最小坐标值确定一个几何图形,对所述几何图形进行分块,并根据所述块之间的距离对所述块进行聚类;若检验所述商户的地址数据被引用的次数不大于第一阈值,则将该商户的地址数据输出到错误记录文件,并结束操作;
排列模块,用于根据每个聚类结果所包括的地址数据的数量,对所述聚类结果进行降序排列;
删除模块,用于计算每个聚类结果的中心和半径,并删除与第一聚类结果的距离大于第二阈值的聚类结果;
输出模块,用于输出所述聚类结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于爱帮聚信(北京)科技有限公司,未经爱帮聚信(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810105995.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种折叠凳子
- 下一篇:一种三折伞的伞骨改良结构