[发明专利]一种基于多元化地理信息点的融合方法有效
申请号: | 201710304829.4 | 申请日: | 2017-05-03 |
公开(公告)号: | CN107256230B | 公开(公告)日: | 2020-08-25 |
发明(设计)人: | 龙华;吕丹;杜庆治;邵玉斌 | 申请(专利权)人: | 昆明理工大学 |
主分类号: | G06F16/29 | 分类号: | G06F16/29 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 650093 云*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 多元化 地理信息 融合 方法 | ||
1.一种基于多元化地理信息点的融合方法,其特征在于具体步骤为:
(A)、信息提取及预处理:在不同地理参考坐标系的地图中,首先进行地图坐标的变换,再找到某个相同区域的地理信息点,然后将提取到的地理信息按照地理名称、经纬度坐标等不同类别进行分类;
(B)、地理信息中的地理名称首先定义相似度:包括分词后的相似度处理、命名实体识别后的相似度处理、排列组合和加法运算四个步骤,根据计算两个相似度值得出的结果情况来判断,如果不相似,则匹配结束,多个地理信息点的地理名称不相同;如果相似或不确定,则进行多个地理信息点经纬度距离之间的匹配;
(C)、经纬度信息处理:通过计算多个地理信息点两两之间的经纬度距离来判断,如果两两之间的距离差值大于某一个门限Δ,则这几个地理信息点不匹配;如果两两之间的距离差值小于某一个门限Δ,则这几个地理信息点匹配;
(D)、相似度结果情况展示:根据得出的最终结果情况,在不同的地图上用不同的颜色标注出来,来判定是否为同一地理信息点;
所述步骤(B)中地理名称的相似度处理,具体包括如下步骤:
(B1)、根据文本分词后的结果计算得到一个相似度值;
(B2)、根据文本命名实体识别后的结果计算得到另一个相似度值;
(B3)、通过排列组合和加法运算来得出最终的结果情况;
(B4)、判断多个地理信息文本是否相似;
所述步骤(B1)中计算句子相似度包括下列步骤:
(B11)、给定一个句子X1,经过汉语分词系统分词后,得到的所有词Yi构成句子X1的向量表示,分词后的向量表示X1=[Y1,Y2,......,Yn];给定句子X2,同理,分词后的向量表示X2=[Y1,Y2,......,Ym];
(B12)、X1中词的个数是X1的向量长度,用Len(X1)表示;同理,X2的向量长度表示为Len(X2);
(B13)、将X1、X2中所有的所有词Yi进行合并,对于重复出现的词只保留一个,由此得到两个向量之和,称为X1、X2的并集,表示X=X1 U X2=[Y1,Y2,......,Ym,Yn],则并集长度Len(X)=Len(X1)+Len(X2);
(B14)、依次计算X1和X2的集合X中的Y1、Y2、......、Ym、Yn在X1中每一个词的相似度,并将所有结果中的最大值称为Yi在X1中的语义分数,用Zi表示;X中每个分词的语义分数组成的一个向量称为X1基于X的语义向量,表示为W1=[Z1,Z2,...,Zn],对于X中的每一个词Yi,如果Yi 在X1 中出现,则在语义向量W1中将Yi 的语义分数Zi设为1;如果X1中不包含Yi,则计算Yi 在 X1 中的语义分数 Zi=N;
(B15)、语义向量计算语义相似度的计算公式如下:
。
2.根据权利要求1所述的基于多元化地理信息点的融合方法,其特征在于:所述步骤(B3)中还包括下列步骤:
步骤(B31)、把步骤(B1)中和步骤(B2)中得到的多种地图的相似度值通过一个排列组合,全部排列起来;
步骤(B32)、把排列起来的相似度值通过加法运算,即全部相加;
步骤(B33)、把加起来的相似度值用一个门限M来控制。
3.根据权利要求1所述的基于多元化地理信息点的融合方法,其特征在于:所述步骤(B4)中还包括下列步骤:
(B41)、若加法后的相似度值小于门限M,则不相似,匹配结束,多个地理信息文本不相同;
(B42)、如果加法后的相似度值大于门限M或在门限M附近,认为相似或不确定,则进行多个地理信息点经纬度距离之间的匹配。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710304829.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种连续值测量统计方法及系统
- 下一篇:一种团队成员识别设备、方法及系统