[发明专利]POI融合阈值的确定方法、装置和电子设备在审
申请号: | 202011182458.5 | 申请日: | 2020-10-29 |
公开(公告)号: | CN112214568A | 公开(公告)日: | 2021-01-12 |
发明(设计)人: | 李明凯;张明飞 | 申请(专利权)人: | 沈阳美行科技有限公司 |
主分类号: | G06F16/29 | 分类号: | G06F16/29;G06F16/9537 |
代理公司: | 北京知呱呱知识产权代理有限公司 11577 | 代理人: | 彭伶俐 |
地址: | 110000 辽宁省沈*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | poi 融合 阈值 确定 方法 装置 电子设备 | ||
本发明实施例公开了POI融合阈值的确定方法、装置和电子设备,该方法包括:获取第一数据提供商提供的第一全量数据集和第二提供商提供的第二全量数据集;对第一全量数据集和第二全量数据集进行数据格式统一得到标准第一数据集和标准第二数据集;对标准第一数据集和标准第二数据集确定主POI源和候选POI源;对主POI源和候选POI源进行融合得到第一POI融合集;根据第一POI融合集确定最小距离和检索距离;根据检索距离阈值和第一POI融合集得到第二POI融合集;根据最小距离、预设的半径增长量,以及第二POI融合集中主POI和匹配的候选POI确定匹配距离阈值。本发明融合效率高,准确度高。
技术领域
本发明实施例涉及数据融合领域,具体涉及POI(Point of Information,信息点)融合阈值的确定方法、装置和电子设备。
背景技术
随着社会的快速发展,各种数据出现了爆炸式的增长。随之而来的,在不同的社会领域中产生了多家数据提供商,他们将自己涉足的领域进行数据整合,对外提供数据服务。
面对社会存在的众多领域,同一领域下又有多家数据提供商,如何将他们提供的数据进行整合就变成了一个系统而复杂的问题。单纯采用人工的方式进行数据整合不仅产能低下,而且人工成本也会非常高。
发明内容
本发明实施例的目的在于提供POI融合阈值的确定方法、装置和电子设备,用以解决现有数据提供商提供的数据难以融合,人工融合成本高、效率低的问题。
为实现上述目的,本发明实施例主要提供如下技术方案:
第一方面,本发明实施例提供了一种POI融合阈值的确定方法,包括:
获取第一数据提供商提供的第一全量数据集和第二提供商提供的第二全量数据集;
对所述第一全量数据集和所述第二全量数据集进行数据格式统一得到标准第一数据集和标准第二数据集;
对所述标准第一数据集和所述标准第二数据集确定主POI源和候选POI源;
对所述主POI源和所述候选POI源进行融合得到第一POI融合集;
根据所述第一POI融合集确定最小距离和检索距离阈值;
根据所述检索距离阈值和所述第一POI融合集得到第二POI融合集;
根据所述最小距离、预设的半径增长量,以及所述第二POI融合集中主POI和候选POI确定匹配距离阈值;
其中,主POI源为POI融合集内两个POI数据源中,任意所指定其中一个POI数据源;候选POI源为POI融合集内两个POI数据源中,主POI源以外的另一个POI数据源;两者共同构建成POI融合集。
根据本发明的一个实施例,根据所述第一POI融合集确定最小距离和检索距离阈值,包括:
从所述第一POI融合集中获取所有主POI及其匹配的候选POI;
计算所述第一POI融合集中的所有主POI及其匹配的候选POI的距离,从所有计算出的距离中确定所述最小距离和最大距离;
根据所述最大距离和预设的膨胀系数确定所述检索距离阈值;
其中,所述主POI为所在数据源中的一个对象,所述候选POI为所在数据源中一个候选对象。
根据本发明的一个实施例,所述根据所述最小距离、预设的半径增长量,以及所述第二POI融合集中主POI和候选POI确定匹配距离阈值,包括:
以所述最小距离为起点,以所述检索距离阈值为终点,从所述起点开始按照所述预设的半径增长量依次递增取值,直到所述终点为止,产生的数值集合定义为半径集合;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于沈阳美行科技有限公司,未经沈阳美行科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011182458.5/2.html,转载请声明来源钻瓜专利网。