[发明专利]聚合兴趣点的方法、装置、设备和介质在审
申请号: | 201811324278.9 | 申请日: | 2018-11-08 |
公开(公告)号: | CN111159318A | 公开(公告)日: | 2020-05-15 |
发明(设计)人: | 李阳 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F16/29 | 分类号: | G06F16/29 |
代理公司: | 北京东方亿思知识产权代理有限责任公司 11258 | 代理人: | 段月欣 |
地址: | 开曼群岛*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 聚合 兴趣 方法 装置 设备 介质 | ||
一种聚合兴趣点的方法、装置、设备和介质,包括:基于输入兴趣点的属性,获取与所述输入兴趣点的相关兴趣点作为候选兴趣点;根据预设规则对所述候选兴趣点进行筛选,将无法判断与所述输入兴趣点是否可以聚合的兴趣点确认为疑似兴趣点;将所述疑似兴趣点输入预先训练的机器学习模型,得到所述疑似兴趣点与所述输入兴趣点之间的相似度;若所述相似度大于预设阈值,则将对应的疑似兴趣点确认为可与所述输入兴趣点聚合的兴趣点。采用本发明实施例后,能够区分当前待处理的兴趣点是否已经存在于数据库中。
技术领域
本发明涉及地图数据处理领域,尤其涉及一种聚合兴趣点的方法、装置、设备和计算机存储介质。
背景技术
兴趣点(Point of Interest,POI)属于地图基础数据,包括名称、类别、坐标和地址等属性。当采集得到待处理的兴趣点时,则需要判断当前待处理的兴趣点是否已经存在于地图数据的数据库中,若当前待处理的兴趣点已经存在于数据库中,则需要将该兴趣点与数据库中的已有兴趣点进行聚合;若当前待处理的兴趣点不存在于数据库中,则需要将该兴趣点存入数据库中。
在兴趣点数据生产的过程中发现:类属于同一兴趣点的两个或者多个待处理兴趣点,在某些属性的记载上可能存在差异;以及,类属于不同兴趣点的两个或者多个兴趣点,在某些属性的记载上又存在相同的情况。基于上述情况,则存在着难以判断当前待处理的兴趣点是否已经存在于数据库中的技术问题。
发明内容
本发明实施例提供了一种聚合兴趣点的方法、装置、设备和计算机存储介质,能够区分当前待处理的兴趣点是否已经存在于数据库中。
一种聚合兴趣点的方法,包括:
基于输入兴趣点的属性,获取与所述输入兴趣点相关的兴趣点作为候选兴趣点;
根据预设规则对所述候选兴趣点进行筛选,将无法判断与所述输入兴趣点是否可以聚合的兴趣点确认为疑似兴趣点;
将所述疑似兴趣点输入预先训练的机器学习模型,得到所述疑似兴趣点与所述输入兴趣点之间的相似度;
若所述相似度大于预设阈值,则将对应的疑似兴趣点确认为可与所述输入兴趣点聚合的兴趣点。
所述基于输入兴趣点的属性,获取与所述输入兴趣点相关的兴趣点作为候选兴趣点,包括:基于所述输入兴趣点的坐标确定候选区域,将所述候选区域内的兴趣点作为候选兴趣点。
所述基于输入兴趣点的属性,获取与所述输入兴趣点相关的兴趣点作为候选兴趣点,包括:
基于所述输入兴趣点的一种属性,将与所述输入兴趣点的相关兴趣点作为初选兴趣点;采用所述输入兴趣点的其他种属性,在所述初选兴趣点中排除与所述输入兴趣点不同的兴趣点,得到所述候选兴趣点。
所述一种属性包括坐标;所述其他种属性包括名称、类别和地址中的一种或多种。
所述将所述疑似兴趣点输入预先训练的机器学习模型,得到所述疑似兴趣点与所述输入兴趣点之间的相似度之前,还包括:
通过正样本集合和负样本集合训练所述机器学习模型,所述正样本集合包括可聚合的兴趣点,所述负样本集合包括不可聚合的兴趣点。
一种聚合兴趣点的装置,包括:
候选模块,用于基于输入兴趣点的属性,获取与所述输入兴趣点的相关兴趣点作为候选兴趣点;
判断模块,用于根据预设规则对所述候选兴趣点进行筛选,将无法判断与所述输入兴趣点是否可以聚合的兴趣点确认为疑似兴趣点;
相似模块,用于将所述疑似兴趣点输入预先训练的机器学习模型,得到所述疑似兴趣点与所述输入兴趣点之间的相似度
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811324278.9/2.html,转载请声明来源钻瓜专利网。