[发明专利]一种地名识别方法和装置有效
申请号: | 201110458103.9 | 申请日: | 2011-12-30 |
公开(公告)号: | CN103186524A | 公开(公告)日: | 2013-07-03 |
发明(设计)人: | 邓小波 | 申请(专利权)人: | 高德软件有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 逯长明 |
地址: | 102200 北京市昌*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 地名 识别 方法 装置 | ||
技术领域
本发明涉及文字信息处理领域,特别涉及一种地名识别方法和装置。
背景技术
随着网络技术的发展,人们可以自由地获取大量的信息。然而对海量的信息资源,如何利用设备自动获取有效的信息,是需要进行技术研究。而如何通过对文字文本内容的分析处理,从中提取需要的信息则无疑将推进信息的有效利用。从文字文本中识别地名,进而提取出地名则是其中重要的一个应用方向。
文本信息中包含地名的场景很多,例如:在日常交流的手机短信中就存在大量地名;网购过程中商家将地址发送到用户手机上;企业通知求职者面试时将面试详细地址发送到求职者的手机上;还有朋友之间通过短信传播的聚会地点等等。
识别的地名进一步的应用则会方便人们的生活,例如:将手机上的地址直观地在地图上展示,并提供路径规划、导航服务。这些应用均需要基于地名识别才可以实现。
发明内容
本发明实施例提供了一种地名识别方法和装置,用以进行地名识别。
一种地名识别方法,包括:
对待识别的字符串进行分词得到候选词;
获取各候选词在地址名称库中的所属类别;
对各候选词进行遍历,若当前候选词的所属类别为第一类别,则将当前候选词作为地名添加到候选地名集合;
若当前候选词的所属类别为第二类别,则对当前候选词以及在所述地址名称库中与当前候选词临近的候选词进行组合得到合成词,并将所述合成词作为地名添加到候选地名集合。
一种地名识别装置,包括:
分词单元,用于对待识别的字符串进行分词得到候选词;
类别获取单元,用于获取各候选词在地址名称库中的所属类别;
地名识别单元,用于对各候选词进行遍历,若当前候选词的所属类别为第一类别,则将当前候选词作为地名添加到候选地名集合;若当前候选词的所属类别为第二类别,则对当前候选词以及在所述地址名称库中与当前候选词临近的候选词进行组合得到合成词,并将所述合成词作为地名添加到候选地名集合。
从以上技术方案可以看出,使用本发明实施例方案:
通过对待识别的字符串进行分词得到候选词;获取各候选词在地址名称库中的所属类别;当某个候选词为第一类别时,则直接将该候选词作为地名加入候选地名集合,则完成该候选词的地名识别,而当某个候选词为第二类别时,需要对该候选词以及在地址名称库中与当前候选词临近的候选词进行组合得到合成词,则完成地名识别,所以,分词得到候选词之后,可以根据候选词的所属类别及与其临近并且属于地址名称库中的候选词进行相应的处理,从而能够进行地名识别。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例地名识别方法一个实施例示意图;
图2为本发明实施例地名识别方法另一实施例示意图;
图3为地名修正对比示意图;
图4为本发明实施例地名识别装置一个实施例示意图;
图5为本发明实施例地名识别装置另一实施例示意图;
图6为本发明实施例地名识别装置另一实施例示意图;
图7为本发明实施例地名识别装置另一实施例示意图;
图8为本发明实施例地名识别装置另一实施例示意图;
图9为本发明实施例地名识别装置另一实施例示意图;
图10为本发明实施例地名识别装置另一实施例示意图;
图11为本发明实施例地名识别装置另一实施例示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部份实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
本发明实施例提供了一种地名识别方法,如图1所示,包括:
101、对待识别的字符串进行分词得到候选词;
本实施例中,当地名识别装置需要进行地名识别时,可以先获取到待识别的字符串,该字符串的来源可以是包含文字的任何文本,例如:短信、网页页面等,可以理解的是,在实际应用中,除了上述限定的来源之外,该字符串还可以从其他方式获取,具体此处不做限定。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于高德软件有限公司,未经高德软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110458103.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种显示波形的软件滤波方法
- 下一篇:双向排版方法和设备