[发明专利]一种基于模糊匹配的中文地理编码确定方法有效

申请号：	200910156650.4	申请日：	2009-12-31
公开（公告）号：	CN101719128A	公开（公告）日：	2010-06-02
发明（设计）人：	张贵军;吴海涛;洪榛;俞立;郭海峰;何尚秋;陈宁宁	申请（专利权）人：	浙江工业大学
主分类号：	G06F17/30	分类号：	G06F17/30
代理公司：	杭州天正专利事务所有限公司 33201	代理人：	王兵;王利强
地址：	310014 ***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：	一种基于模糊匹配的中文地理编码确定方法，包括以下步骤：A1、读入描述性中文地址信息，以行政区级别为断点，采用正向最大搜索方法，对原始地址进行切分，得到原始地址元素数组；A2、将原始地址元素通过地址词典进行标准化；A3、读取标准地址树，采用分支定界算法，对原始地址元素数组进行匹配；同时，应用模糊规则对匹配操作进行控制：在获取原始地址切分后的关键字后；评价分数最高的作为最相近匹配结果，即得到更为精确的匹配地址。本发明提供一种地址模型合理、匹配率较高、快速性良好的基于模糊匹配的中文地理编码确定方法。
搜索关键词：	一种基于模糊匹配中文地理编码确定方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种基于模糊匹配的中文地理编码确定方法，其特征在于：所述中文地理编码确定方法包括以下步骤：A1、读入描述性中文地址信息，以行政区级别为断点，采用正向最大搜索方法，对原始地址进行切分，得到原始地址元素数组；A2、将原始地址元素通过地址词典进行标准化；A3、读取标准地址树，采用分支定界算法，对原始地址元素数组进行匹配：建立地址树存储格式的地址数据库，根据中国行政区的层次化划分，建立树状地址存储树，级别最高的行政区单位作为地址树的根结点，其下属行政区作为子结点进行保存；依据对描述性中文地址信息切分后的地址要素和门牌号，在匹配过程中，首先读取标准地址树R，判断通过切分后的候选地址要素中最高行政级别的关键字，与标准地址树R的对应行政级别的地址结点进行匹配，匹配成功后舍弃不相关分支树，保留相关分支树进行下一行政级别匹配；同时，应用模糊规则对匹配操作进行控制：在获取原始地址切分后的关键字后，还包括：采用模糊匹配规则对匹配操作进行优化，模糊匹配规则定义如下：假定匹配字段为字符串address，长度为h；标准字段为字符串std_address，长度为H；定义满足address∩std_address≠Φ的std_address集合为满足匹配条件的集合，其中，address∩std_address≠Φ表示字符串address与标准字段字符串std_address交集不为空，最后保留隶属度高的集合元素；定义如下匹配规则：①标准字符串std_address和匹配字符串address中i个字符相同，则隶属度为i/H；②标准字符串std_address包含匹配字符串address，则隶属度为1；得到隶属度之后，设定μ为匹配隶属度，按照映射规则f：sc→μ转化为量化分值，映射函数：f(μ)＝10×μ，将sc作为该候选记录的评价分数；评价分数最高的作为最相近匹配结果，即得到更为精确的匹配地址。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于浙江工业大学，未经浙江工业大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/200910156650.4/，转载请声明来源钻瓜专利网。

上一篇：一种β-型二氧化铅纳米颗粒的制备方法
下一篇：分段研磨硅酸锆的方法及装置

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F17-00 特别适用于特定功能的数字计算设备或数据处理设备或数据处理方法
G06F17-10 .复杂数学运算的
G06F17-20 .处理自然语言数据的
G06F17-30 .信息检索；及其数据库结构
G06F17-40 .数据的获取和记录
G06F17-50 .计算机辅助设计

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于模糊匹配的中文地理编码确定方法有效

专利文献下载