[发明专利]一种计算样本数据之间的距离的方法及设备在审
申请号: | 201810247666.5 | 申请日: | 2018-03-23 |
公开(公告)号: | CN110298679A | 公开(公告)日: | 2019-10-01 |
发明(设计)人: | 刘洋;蒋丰泽;赵晓东 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06K9/62 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 冯艳莲 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请公开了一种计算样本数据之间的距离的方法及设备,可以使计算出的不同样本数据之间的距离能够准确地体现样本数据之间的相似性。在该方案中,客户挖掘设备需要根据与种子客户样本数据相似性最低的P个候选客户的样本数据,以及种子客户的样本数据计算度量矩阵,且该度量矩阵满足:通过度量矩阵计算实际上相似的样本数据(种子客户的样本数据)之间的距离较小,实际上不相似的样本数据(P个候选客户的样本数据)之间的距离较大,显然,基于该度量矩阵计算得到的两个样本数据之间的距离可以更能体现这两个样本数据之间的相似度。 | ||
搜索关键词: | 样本数据 度量 客户 矩阵 矩阵计算 客户挖掘 设备需要 相似度 申请 | ||
【主权项】:
1.一种样本数据相似性计算方法,其特征在于,包括:获取M个种子客户的样本数据和N个候选客户的样本数据,M、N均为大于2的整数;在所述N个候选客户的样本数据中,选择出与所述M个种子客户的样本数据相似性最低的P个第一样本数据,P为大于2的整数;根据所述M个种子客户的样本数据和所述P个第一样本数据,确定度量矩阵;其中,所述度量矩阵为半正定矩阵,所述度量矩阵中每个元素大于0,所述度量矩阵满足以下条件:基于所述度量矩阵计算的所述M个种子客户的样本数据中所有不同种子客户的样本数据之间的距离之和最小,且基于所述度量矩阵计算的所述P个第一样本数据中所有不同第一样本数据之间的距离之和大于设定距离阈值;基于所述度量矩阵,计算所述M个种子客户的样本数据和所述N个候选客户的样本数据中不同样本数据之间的距离。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810247666.5/,转载请声明来源钻瓜专利网。