[发明专利]一种基于分词算法的地址解析方法及装置在审
申请号: | 201810988592.0 | 申请日: | 2018-08-28 |
公开(公告)号: | CN109145073A | 公开(公告)日: | 2019-01-04 |
发明(设计)人: | 余刚 | 申请(专利权)人: | 成都市映潮科技股份有限公司 |
主分类号: | G06F16/29 | 分类号: | G06F16/29;G06F16/33;G06F16/387 |
代理公司: | 成都创新引擎知识产权代理有限公司 51249 | 代理人: | 向群 |
地址: | 610041 四川省成都*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于分词算法的地址解析方法及装置,该方法包括:收集国家统计局行政区划数据并存入数据库中,对地域名称进行编码,建立地域级联关系;构建地域决策树,将国家作为地域决策树的根节点,省/直辖市作为其下级节点,根据地域级联关系递归创建该地域决策树的子节点与叶子节点;根据地域全称与地域简称构建自定义地域字典并加载到数据库中;获取地域信息,以分词算法结合自定义地域字典对所述地域信息进行分词处理,得到地域词组;根据分词后出现的地域词组先后顺序结合地域决策树进行地址解析,得到地址信息。该发明解决了目前地图工具里面自带的短文本地域解析功能存在的解析精度低及耗时长的问题。 | ||
搜索关键词: | 地域 决策树 分词 地址解析 地域信息 级联关系 词组 自定义 构建 算法 解析 字典 数据库 地图工具 地址信息 分词处理 顺序结合 算法结合 下级节点 叶子节点 短文本 根节点 子节点 行政区划 递归 加载 自带 耗时 创建 | ||
【主权项】:
1.一种基于分词算法的地址解析方法,其特征在于,该方法包括:收集国家统计局行政区划数据并存入数据库中,对地域名称进行编码,建立地域级联关系;构建地域决策树,将国家作为地域决策树的根节点,省/直辖市作为其下级节点,根据地域级联关系递归创建该地域决策树的子节点与叶子节点;根据地域全称与地域简称构建自定义地域字典并加载到数据库中;获取地域信息,以分词算法结合自定义地域字典对所述地域信息进行分词处理,得到地域词组;根据分词后出现的地域词组先后顺序结合地域决策树进行地址解析,得到地址信息。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都市映潮科技股份有限公司,未经成都市映潮科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810988592.0/,转载请声明来源钻瓜专利网。