[发明专利]地址信息的处理方法、终端设备及计算机可读存储介质在审
申请号: | 201811084954.X | 申请日: | 2018-09-18 |
公开(公告)号: | CN109388634A | 公开(公告)日: | 2019-02-26 |
发明(设计)人: | 吴壮伟;钟宇;凌羽;赵小梅 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F16/215 | 分类号: | G06F16/215 |
代理公司: | 深圳中一专利商标事务所 44237 | 代理人: | 官建红 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 原地址信息 备选地址 地址信息 文本 计算机可读存储介质 地图信息 目标地址 终端设备 网站 预设 匹配 计算机应用技术 数据清理 数据清洗 模板化 清洗 规范化 统一 | ||
1.一种地址信息的处理方法,其特征在于,包括:
接收待处理的原地址信息;
将所述原地址信息通过预设的数据清洗模型进行数据清洗,生成所述原地址信息的文本摘要;所述清洗模型为基于预设的语料库进行训练得到;
将所述文本摘要输入到预设的地图信息网站中,得到至少一个备选地址;
根据所述文本摘要和所述备选地址,识别与所述原地址信息匹配的备选地址为目标地址。
2.如权利要求1所述的地址信息的处理方法,其特征在于,所述将所述原地址信息通过预设的数据清洗模型进行数据清洗,生成所述原地址信息的文本摘要之前,还包括:
基于预设的条件随机场算法模型、预设的注意力模型和预设的文本摘要生成模型,对所述语料库进行训练,得到数据清洗模型;
所述数据清洗模型用于对所述原地址信息进行数据清洗,得到文本摘要;所述文本摘要包括至少一个用于表示所述原地址信息的关键词。
3.如权利要求1所述的地址信息的处理方法,其特征在于,所述将所述文本摘要输入到预设的地图信息网站中,得到至少一个备选地址,包括:
通过至少一个所述地图信息网站对所述文本摘要进行搜索,从每个所述地图信息网站中获取所述文本摘要的备选地址信息;
所述备选地址信息中包括:地图供应商、地图提供的兴趣点名称以及与所述原地址信息对应的详细地址。
4.如权利要求2所述的地址信息的处理方法,其特征在于,所述根据所述文本摘要和所述备选地址,识别与所述原地址信息匹配的备选地址为目标地址,包括:
统计每个所述备选地址中所包含的关键词;
根据所述每个所述备选地址中所包含的关键词、所述文本摘要中关键词的总个数,计算每个所述备选地址与所述文本摘要的匹配度;
识别匹配度最高的备选地址为所述目标地址。
5.如权利要求4所述的地址信息的处理方法,其特征在于,所述根据所述每个所述备选地址中所包含的关键词、所述文本摘要中关键词的总个数,计算每个所述备选地址与所述文本摘要的匹配度,包括:
通过公式计算所述备选地址与所述文本摘要的匹配度;其中,word_1,word_2,...,word_n用于表示每个所述关键词;N用于表示所述文本摘要中的关键词总个数;矩阵Dev_n=(dev_1,dev_2,…,dev_n)用于表示每个类型的关键词的贡献权值;矩阵Word_n=(word_1,word_2,...,word_n)用于表示所述备选地址中所包含的关键词对应的二进制编码,若所述备选地址中包含一个关键词,则对应的值为1,不包含则为0。
6.一种终端设备,其特征在于,包括存储器以及处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时,实现如下步骤:
接收待处理的原地址信息;
将所述原地址信息通过预设的数据清洗模型进行数据清洗,生成所述原地址信息的文本摘要;所述清洗模型为基于预设的语料库进行训练得到;
将所述文本摘要输入到预设的地图信息网站中,得到至少一个备选地址;
根据所述文本摘要和所述备选地址,识别与所述原地址信息匹配的备选地址为目标地址。
7.如权利要求6所述的终端设备,其特征在于,所述将所述原地址信息通过预设的数据清洗模型进行数据清洗,生成所述原地址信息的文本摘要之前,还包括:
基于预设的条件随机场算法模型、预设的注意力模型和预设的文本摘要生成模型,对所述语料库进行训练,得到数据清洗模型;
所述数据清洗模型用于对所述原地址信息进行数据清洗,得到文本摘要;所述文本摘要包括至少一个用于表示所述原地址信息的关键词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811084954.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数据清洗方法
- 下一篇:一种多值数据基于二进制和字典表的数据存储法