[发明专利]一种不同数据源的兴趣点的模糊匹配方法有效

专利信息
申请号: 201510430517.9 申请日: 2015-07-22
公开(公告)号: CN105045880B 公开(公告)日: 2018-09-18
发明(设计)人: 郭文忠;陈羽中;於志勇;赵水源 申请(专利权)人: 福州大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 福州元创专利商标代理有限公司 35100 代理人: 蔡学俊
地址: 350108 福建省福州市*** 国省代码: 福建;35
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明涉及一种不同数据源的兴趣点的模糊匹配方法,包括以下步骤:1、分别从两个不同的网站中采集兴趣点数据构成数据集A、B;2、提取名称完全匹配的兴趣点配对形成数据样本,通过数据样本计算平均位置偏差并确定匹配范围;3、分别从数据集A、B中取待匹配点和待匹配集;4、对待匹配点和待匹配集中所有兴趣点的名称进行逐级地址分词,然后通过地址词典过滤名称中的地址信息;5、采用KMP算法对待匹配点和待匹配集中每个兴趣点进行匹配,通过匹配率判断兴趣点是否相同;6、同理,对数据集A中的其他兴趣点,在数据集B中找出与其匹配的兴趣点。该方法有利于精确匹配不同数据源的兴趣点数据,过滤重复的数据。
搜索关键词: 一种 不同 数据源 兴趣 模糊 匹配 方法
【主权项】:
1.一种不同数据源的兴趣点的模糊匹配方法,其特征在于,包括以下步骤:步骤S1:分别从两个不同的网站中采集兴趣点数据,其中包括兴趣点的名称、地址、经度、纬度信息,构成数据集A和数据集B;步骤S2:从所述数据集A、B中找出名称完全匹配的兴趣点配对形成数据样本,计算数据样本中所有配对的兴趣点之间的位置偏差,所述位置偏差包括两兴趣点之间的偏差距离和偏差角度;去噪处理后,计算平均位置偏差,包括平均偏差距离和平均偏差角度,并确定匹配范围;步骤S3:取数据集A中的一个兴趣点作为待匹配点,根据步骤S2获得的平均偏差距离d、平均偏差角度o,找出数据集B中所有在待匹配点匹配范围内的兴趣点组成待匹配集;步骤S4:对地址分词字段建立逐级的父子关系,并根据地址分词字段之间的关系对所述待匹配点的地址进行逐级地址分词,并采用地址分词得到的地址字段形成临时的地址词典,然后通过所述临时的地址词典过滤待匹配点和待匹配集中所有兴趣点的名称中的地址信息;步骤S5:基于已过滤掉地址信息的名称,采用KMP算法对待匹配点和待匹配集中每个兴趣点进行匹配,当某个兴趣点使匹配率最大且所述匹配率大于设定值时,则判定该兴趣点与待匹配点属于同一个兴趣点;步骤S6:对数据集A中的其他兴趣点,按步骤S3~S5的方法,在数据集B中找出与其匹配的兴趣点;所述待匹配点匹配范围为:以与待匹配点偏差的距离为平均偏差距离d、偏差的角度为平均偏差角度o的点为中心,以匹配半径r为半径的圆;步骤S2中,形成数据样本并确定平均位置偏差和匹配范围的方法为:步骤S201:找出所述数据集A、B中名称完全匹配的兴趣点,配对形成数据样本集合{TS(a1,b1),TS(a2,b2),…,TS(ai,bi),…,TS(an,bn)},TS(ai,bi)表示第i个完全匹配对,即数据集A的兴趣点ai与数据集B的兴趣点bi的名称完全匹配,i∈{1,2,…,n},n为集合长度;步骤S202:对每个完全匹配对TS(ai,bi)求ai与bi之间的偏差距离和偏差角度,得到与数据样本集合对应的偏差距离集合{d1,d2,…,di,…,dn}和偏差角度集合{o1,o2,…,oi,…,on},di表示ai与bi之间的偏差距离,oi表示ai与bi之间的偏差角度;计算方法如下:上式中,lat(ai)、lat(bi)分别为兴趣点ai、bi的纬度,lon(ai)、lon(bi)分别为兴趣点ai、bi的经度,R为地球半径;上式中,Rj为极半径;步骤S203:分别去除所述偏差距离集合和偏差角度集合的噪声点,得到去噪后的偏差距离集合{dp|p∈D}和去噪后的偏差角度集合{oq|q∈O},其中D为所述偏差距离集合中非噪声点的下标的集合,O为所述偏差角度集合中非噪声点的下标的集合,保留下标同时存在于集合D和集合O中的偏差距离和偏差角度,形成处理后的偏差距离集合{dj|j∈N}和处理后的偏差角度集合{oj|j∈N},其中N=D∩O,即为同时存在于集合D和集合O中的下标集合;步骤S204:求取处理后的偏差距离集合的平均偏差距离d和处理后的偏差角度集合的平均偏差角度o,所述平均偏差距离d和平均偏差角度o确定了匹配范围的中心,求取处理后的偏差距离集合中两两距离差,最大的距离差r即为匹配范围的匹配半径,计算方法为:r=max(dx‑dy)上式中,dj∈{dj|j∈N},oj∈{oj|j∈N},len(N)表示下标集合N的长度,x、y∈N且x≠y。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201510430517.9/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top