[发明专利]一种地名匹配方法及装置有效
申请号: | 201310034595.8 | 申请日: | 2013-01-29 |
公开(公告)号: | CN103106264A | 公开(公告)日: | 2013-05-15 |
发明(设计)人: | 程钢;卢小平;于海洋;文运平;杨杰 | 申请(专利权)人: | 河南理工大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王宝筠 |
地址: | 454150 河南*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 地名 匹配 方法 装置 | ||
1.一种地名匹配方法,应用于中文地名,其特征在于,包括:
将第一地名及第二地名分别分解为专名和通名;
计算所述第一地名的专名与所述第二地名的专名的专名相似度;
计算所述第一地名的通名与所述第二地名的通名的通名相似度;
依据所述专名相似度和所述通名相似度,确定所述第一地名与所述第二地名的相似度。
2.根据权利要求1所述的方法,其特征在于,所述将第一地名及第二地名分别分解为专名和通名包括:
去除第一地名中的非法字符后,将所述第一地名与预设的通名词库进行对比,确定所述第一地名中的通名;
从所述第一地名去除所述第一地名中的通名,得到所述第一地名中的专名;
去除第二地名中的非法字符后,将所述第二地名与所述预设的通名词库进行对比,确定所述第二地名中的通名;
从所述第二地名去除所述第二地名中的通名,得到所述第二地名中的专名。
3.根据权利要求1所述的方法,其特征在于,所述计算所述第一地名的专名与所述第二地名的专名的专名相似度包括:
确定所述第一地名的专名与所述第二地名的专名间的中文编辑距离;
依据所述中文编辑距离及所述第一地名的专名的中文长度和所述第二地名的专名的中文长度中的较大者,计算所述第一地名的专名与所述第二地名的专名的相似度。
4.根据权利要求1所述的方法,其特征在于,所述计算所述第一地名的通名与所述第二地名的通名的通名相似度包括:
确定所述第一地名的通名与所述第二地名的通名间的语义距离、概念深度、概念密度及关系类型;
依据所述语义距离、概念深度、概念密度及关系类型计算所述通名的语义相似度。
5.根据权利要求1所述的方法,其特征在于,所述依据所述专名相似度和所述通名相似度,确定所述第一地名与所述第二地名的相似度包括:
依据预设的权重计算规则,确定所述专名相似性的第一权重,及所述通名相似性的第二权重;
依据所述第一权重、第二权重、所述第一地名的专名、所述第一地名的通名、所述第二地名的专名、所述第二地名的通名,计算所述第一地名与所述第二地名的相似度。
6.一种地名匹配装置,应用于中文地名,其特征在于,包括:
地名分解模块,用于将第一地名及第二地名分别分解为专名和通名;
专名相似度计算模块,用于计算所述第一地名的专名与第二地名的专名的专名相似度;
通名相似度计算模块,用于计算所述第一地名的通名与所述第二地名的通名的通名相似度;
地名相似度确定模块,用于依据所述专名相似度和所述通名相似度,确定所述第一地名与所述第二地名的相似度。
7.根据权利要求6所述的装置,其特征在于,所述地名分解模块包括:
过滤模块,用于在将第一地名及第二地名分别分解为专名和通名之前,去除所述第一地名及第二地名中的非法字符;
通名确定单元,用于将所述第一地名及第二地名与预设的通名词库进行对比,确定所述第一地名及第二地名各自的通名;
专名确定单元,用于从所述第一地名中去除所述第一地名中的通名,得到所述第一地名中的专名,及从所述第二地名中去除所述第二地名中的通名,得到所述第二地名中的专名。
8.根据权利要求6所述的装置,其特征在于,所述专名相似度计算模块包括:
编辑距离确定单元,用于确定所述第一地名的专名与所述第二地名的专名间的中文编辑距离;
专名的相似度计算单元,用于依据所述中文编辑距离及所述第一地名的专名的长度和所述第二地名的专名的长度中的较大者,计算所述第一地名的专名与所述第二地名的专名的相似度。
9.根据权利要求6所述的装置,其特征在于,所述通名相似度计算模块包括:
参数确定单元,用于确定所述第一地名的通名与所述第二地名的通名间的语义距离、概念深度、概念密度及关系类型;
通名语义相似度计算单元,用于依据所述语义距离、概念深度、概念密度及关系类型计算所述通名的语义相似度。
10.根据权利要求6所述的装置,其特征在于,所述地名相似度确定模块包括:
权重确定单元,用于依据预设的权重计算规则,确定所述专名相似度的第一权重,及所述通名相似度的第二权重;
地名相似度计算单元,用于依据所述第一权重、第二权重、所述专名相似度及所述通名相似度,计算所述第一地名与所述第二地名的相似度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河南理工大学,未经河南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310034595.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种PLM系统中的文件处理方法
- 下一篇:一种便携式翻盖汉语教学收音装置