[发明专利]一种基于集合运算的中文地址行政区划解析方法有效
申请号: | 201510980148.0 | 申请日: | 2015-12-23 |
公开(公告)号: | CN105677700B | 公开(公告)日: | 2018-12-14 |
发明(设计)人: | 李晓林;黄爽;张彦铎;卢涛;段艳会;张玉敏;万永静;杨威 | 申请(专利权)人: | 武汉工程大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 湖北武汉永嘉专利代理有限公司 42102 | 代理人: | 唐万荣 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于集合运算的中文地址行政区划解析方法,该方法包括以下步骤:首先利用行政区划字典和移动窗口最大匹配算法,从中文地址中提取所有可能的行政区划数据集,然后利用中文地址行政区划元素之间具有层次关系的特点,建立行政区划条件集合运算规则,最后对行政区划集合进行条件集合运算,得到信息量最完整最准确的中文地址的行政区划。本发明方法解决了在互联网中中文地址数据混乱无序的情况下快速解析出中文地址行政区划的问题,并能得到信息量最完整最准确的中文地址的行政区划解析结果。 | ||
搜索关键词: | 一种 基于 集合 运算 中文 地址 行政区划 解析 方法 | ||
【主权项】:
1.一种基于集合运算的中文地址行政区划解析方法,包括以下步骤:1)利用行政区划字典和移动窗口最大匹配算法,查询匹配出所需解析的中文地址字符串中所有可能的行政区划结果集;2)根据步骤1)得到的所有可能的行政区划结果集,进行条件集合运算;行政区划条件集合运算规则如下:一个行政区划是包括省、市、县、乡、村5级行政区划元素,并按照省、市、县、乡、村的次序组成,于是行政区划D记为:D={d1,d2,d3,d4,d5};2.1)1个行政区划集合的交集;一个行政区划集合DS={D1,D2,...,Dm},并且D1,D2,...,Dm的省级区划元素都不为空,则行政区划集合DS的交集为DI(D1,D2,...,Dm);用公式(1)表示:DI(D1,D2,...,Dm)=∩DS=∩{D1,D2,...,Dm}=D1∩D2∩...∩Dm (1)2.2)多个行政区划集合的交集;多个行政区划集合的交为多个行政区划集合分别两两相交结果的集合,记为DSI;用公式(2)表示:若上述两两相交结果的集合中有运算结果为空的,则将对应的行政区划的交运算变成并运算;步骤2)中计算行政区划的交集具体规则如下:由于行政区划元素之间存在包含关系,即除了省级区划外,其它各级区划都属于1个或多个上级行政区划,先计算省级行政化元素的交,再计算非省级区划元素的交;a)省级行政区划元素的交规则如下:当省级区划元素相等时,则交的结果为该省级区划元素;当省级区划元素不相等,且省级区划元素都不为空,则交的结果为空;当省级区划元素不相等,且区划元素有一个为空时,此时需要对省级区划元素为空的行政区划利用行政区划字典查询得到其省级区划元素再进行计算交的结果;b)非省级区划元素的交结果采用以下规则;当区划元素相等时,则交的结果为区划元素;当区划元素不相等,且区划元素都不为空,则结果为空;当区划元素不相等,且区划元素有一个为空时,如果存在非空的交父元素,结果为非空区划元素值;3)根据步骤2)条件集合运算的结果输出解析出的行政区划。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉工程大学,未经武汉工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510980148.0/,转载请声明来源钻瓜专利网。
- 上一篇:一种语料检索匹配方法
- 下一篇:检索设备和检索方法