[发明专利]一种基于地点POI的大数据解析地址文本的方法有效

专利信息
申请号: 202011589770.6 申请日: 2020-12-29
公开(公告)号: CN112732779B 公开(公告)日: 2022-12-30
发明(设计)人: 刘超群 申请(专利权)人: 合肥市智享亿云信息科技有限公司
主分类号: G06F16/2458 分类号: G06F16/2458;G06F16/29;G06F16/34;G06F16/951;G06F40/205
代理公司: 暂无信息 代理人: 暂无信息
地址: 230000 安徽省*** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 地点 poi 数据 解析 地址 文本 方法
【权利要求书】:

1.一种基于地点POI的大数据解析地址文本的方法,其特征在于:包括如下步骤: S1、城市POI基础数据处理; S2、匹配地址文本解析;

S3、数据分析及可视化展示;

S1中城市POI基础数据处理具体包括如下步骤:

S11:POI数据爬取;

S12:POI名称优化;

S13:POI别名自动处理;

S14:POI人工调优;

S11中POI数据爬取的具体操作为:

a.对线上地图,以多次、不同范围的矩形扫描方式爬取地点POI,同时可继续探索其他数据获取方式,包括其他网站,政府统计数据;

b.将爬取的POI数据分类存储到数据库;

S12中POI名称优化的具体操作为:

a.去除明显无效及重复的数据;

b.POI名有包含关系,判断距离,如小于200米则合并且处理;

c.名称含“XX省”、“XX市”的,优化为“省”及“市”;针对地产类:如有且只有含有“一期”、“一栋”、“A座”,则去除“一期”、“一栋”、“A座”;

d.针对地产类写字楼:自动合并“A座”、“A栋”并重命名,去掉“B座”、“C座”等;

S13中POI别名自动处理的具体操作为:

1)针对地产类:

a.智能提取“-”及“·”中的前缀,如“XX-#名郡”,提取“XX”并保存到 tag_poi;

b.遇到类似“XX-#名郡”、“XX#名郡”,智能添加备注“#名郡”;

2)针对政府单位类:

a.XX村村民员会,可简称为XX村委;

b.XX镇委员会,可简称为XX镇委、XX市委;

c.XX镇纪律检查委员会,可简称为XX镇纪委、XX市纪委;

d.XX镇人民政府,可简称为XX镇政府、XX市政府;

S14中POI管理界面的具体操作为:WEB端给管理员,用于人工补充POI、修正POI别名和备注;

S2中匹配地址文本解析具体包括如下步骤:

S21:处理流程;

S22:地址最终定位处理;

S21中处理流程的具体操作为:

1)数据预处理,抛弃明显错误的地址,如空白、只有省市区道路名的地址等分类单独存储;

2)路口、交叉口、路号全称匹配,以实际路口、交叉口、道路名+路号基础数据,统一格式化处理,匹配地址对应的道路信息;

3)道路尾部路号补齐,处理包含如“长江西路339”的地址,补齐为“长江西路339号”;

4)道路拼音匹配,地址中文拼音匹配道路名+路号;

5)道路智能匹配,地址模糊匹配道路名+路号、或路口,AI文本相似度匹配,处理错字,多字,少字的模糊匹配;

6)POI全称别名匹配,其中房产类型优先匹配,poi名称长度优先匹配,特殊符号别名自动处理,获取地址对应的POI;

7)POI全称、别名拼音匹配,住宅区、学校类型poi,参与拼音匹配;

8)POI智能匹配,AI文本相似度匹配,模糊匹配,参与智能匹配的poi类型为住宅区、高校、综合医院;

S22中地址最终定位处理的具体操作为:

1)POI全称匹配地址处理:

地址当前匹配的POI,是否与匹配的道路信息对应,如果正确对应,则以POI定位,若不对应,以全称/补齐匹配的街道信息为准,其中住宅区类型以POI名称定位,无道路信息,以POI定位;

2)POI别名匹配地址处理:

存在全称匹配道路信息,以道路信息定位,否则,当存在多个别名匹配到的POI,以长度最大的定位,无道路信息,以POI定位;

3)POI模糊匹配地址处理:

存在道路全称匹配以道路信息定位,不存在道路信息,多个POI名称最长定位,道路模糊和POI模糊匹配名称最长定位;

4)POI未匹配地址处理:

道路全称匹配定位,道路模糊匹配定位,最终剩余未处理;

5)POI重名处理:

地址匹配到的POI,存在多个重名时,需要根据区域道路信息确定,若无法区分,则丢弃,地址与POI所属区域不同,丢弃。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥市智享亿云信息科技有限公司,未经合肥市智享亿云信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011589770.6/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top