[发明专利]景点名称文本相似性检测方法、系统、设备及存储介质在审
申请号: | 202010231137.3 | 申请日: | 2020-03-27 |
公开(公告)号: | CN111460243A | 公开(公告)日: | 2020-07-28 |
发明(设计)人: | 李玲;田乾章;陈剑明 | 申请(专利权)人: | 上海携程商务有限公司 |
主分类号: | G06F16/9032 | 分类号: | G06F16/9032;G06F16/909;G06F40/194;G06K9/62;G06Q50/14 |
代理公司: | 上海隆天律师事务所 31282 | 代理人: | 夏彬 |
地址: | 200335 上海市长*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种景点名称文本相似性检测方法、系统、设备及存储介质,该相似性检测方法包括如下步骤:获取地理兴趣点数据库,所述地理兴趣点数据库包括多条地理兴趣点数据;对各条所述地理兴趣点数据进行分词;根据建立的停用库去掉各条所述地理兴趣点数据中的停用词;计算每两条所述地理兴趣点数据之间的相似度;根据相似度合并重复的所述地理兴趣点数据。本发明方法通过建立停用词库,根据具体场景建立停用词库对数据库做重复文件检查,尤其是景点名称文本数据库,可以有效地去除重复的地理兴趣点数据,提高数据库的数据质量。 | ||
搜索关键词: | 景点 名称 文本 相似性 检测 方法 系统 设备 存储 介质 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海携程商务有限公司,未经上海携程商务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202010231137.3/,转载请声明来源钻瓜专利网。