[发明专利]一种基于多元化地理信息点的融合方法有效
申请号: | 201710304829.4 | 申请日: | 2017-05-03 |
公开(公告)号: | CN107256230B | 公开(公告)日: | 2020-08-25 |
发明(设计)人: | 龙华;吕丹;杜庆治;邵玉斌 | 申请(专利权)人: | 昆明理工大学 |
主分类号: | G06F16/29 | 分类号: | G06F16/29 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 650093 云*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 多元化 地理信息 融合 方法 | ||
本发明涉及一种基于多元化地理信息点的融合方法,属于地理信息处理技术领域。通过在不同地理参考坐标系的地图中找到某个相同的区域,进行地理信息数据匹配并寻找出不同地图的地理信息,是否有相同的信息点,涉及到地理和信息处理领域。本发明包括下列步骤:多个地理信息点中的地理名称通过定义相似度,根据文本分词和文本命名实体识别后的结果计算得到多个相似度值,然后通过排列组合和加法运算的最终结果情况来判断多个地理信息点的地理名称是否相似,如果不相似,则匹配结束,多个地理信息点的地理名称不相同;如果相似或不确定,则进行多个地理信息点经纬度距离之间的匹配。
技术领域
本发明涉及一种基于多元化地理信息点的融合方法,属于地理信息处理技术领域。
背景技术
近年来,随着网络的大规模发展,各种信息资源的数量急剧增长,计算机对地理名称、坐标信息等各种自然语言处理应用的普及,人们需要一个快速且准确的方法来计算多个地理信息点之间的信息相似度。尤其,短文本相似度的计算具有十分重要的作用,它的应用能够极大地提高识别多个地理信息点的精度。另外,地图中的经纬度信息对于邻近区域的查询具有很大的便利,建立地理信息点的融合方法对查询起到非常重要的作用。
对于约占人类信息80%左右的地理信息来说,由于具有分布性、多样性、复杂性的特点,给地理信息的共享和操作带来了许多不便。大部分地理信息是表示在不同地图上的,面对浩如烟海的地理信息,能够快速、准确、高质量地从中抽取出用户所关心、真正有用的信息这一需求日益迫切,然而,对于提取到的地理信息处理手段较弱,导致信息排查困难和信息利用率低下。同时,目前地理信息资源的提供者对数据的描述值停留在数据的表明层次上,数据之间缺乏必要的关联,从而直接影响到用户获取信息的速度和效率。快速并高质量的融合方法可以将大量地理信息进行分类处理,找出匹配的信息点,以及不匹配的信息点,从而通过这种方法来减轻工作量,方便人们对地理信息的充分利用。
由于越来越多的短文本应用的出现,比如电子文本,地理信息和地图信息,人们对短文本处理的需求日益迫切。但是对于短文本而言,因为相似的短文本并不一定有相同的词,自然语言的灵活性使得人们可以通过不同的措词表达相同的意思,所以现有的相似度计算方法应用效果并不很好,例如在对地理位置名称的数据处理中表现不佳。此外,传统的文本相似度计算过程中,对文本的表达方式通常去掉停用词,比如“的”,“是”,“中”等等,但是在对短文本的处理过程中,因为它们蕴含了一些句子的结构信息,所以一些停用词不能被忽略,这使得传统的文本相似度计算方法在处理短文本的文本相似度计算过程中不能得到很好的结果。
对文本相似度计算而言,常用的文本间相似度计算方法是余弦相似度方法,该方法将文本看作空间中的一个点并将其表示为向量形式,利用向量之间的夹角大小来定量地计算文本间相似度,该方法没有考虑文本间具有相同语义的特征词,不能充分体现文本之间的语义相似性。因此,现有相似度计算方法存在大量的缺点和疏漏。
发明内容
本发明要解决的技术问题是提供一种基于多元化地理信息点的融合方法,通过在不同地理参考坐标系的地图中找到某个相同的区域,进行地理信息数据匹配并寻找出不同地图的地理信息是否有相同的信息点。
本发明的技术方案是:一种基于多元化地理信息点的融合方法,具体步骤为:
(A)、信息提取及预处理:在不同地理参考坐标系的地图中,首先进行地图坐标的变换,再找到某个相同区域的地理信息点,然后将提取到的地理信息按照地理名称、经纬度坐标等不同类别进行分类;
(B)、地理信息中的地理名称首先定义相似度:包括分词后的相似度处理、命名实体识别后的相似度处理、排列组合和加法运算四个步骤,根据计算两个相似度值得出的结果情况来判断,如果不相似,则匹配结束,多个地理信息点的地理名称不相同;如果相似或不确定,则进行多个地理信息点经纬度距离之间的匹配;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710304829.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种连续值测量统计方法及系统
- 下一篇:一种团队成员识别设备、方法及系统