[发明专利]数据匹配方法、系统、计算机设备和计算机可读存储介质在审
申请号: | 201910872804.3 | 申请日: | 2019-09-16 |
公开(公告)号: | CN110766047A | 公开(公告)日: | 2020-02-07 |
发明(设计)人: | 徐宁;刘会哲;王远;喻宁 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 11015 北京英特普罗知识产权代理有限公司 | 代理人: | 王勇 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 源对象 数据匹配 条件特征 目标对象 基本信息 特征向量 推送 向量 匹配 计算机设备 数据推送 获取源 可存储 客户端 构建 标签 关联 计算机 | ||
1.一种数据匹配方法,其特征在于,所述方法包括:
从一个或多个设备中获取源对象的源对象信息,所述源对象信息包括源对象基本信息和目标对象信息;
根据所述源对象基本信息构建所述源对象特征向量,所述源对象特征向量包括用于表征源对象能力的多个特征标签的多个源对象特征参数;
根据所述源对象特征向量与条件特征向量,生成所述源对象和目标对象之间的数据匹配策略,其中,所述条件特征向量包括匹配所述目标对象所需的多个条件特征标签对应的多个条件特征参数;及
推送所述数据匹配策略至所述源对象关联的客户端中,以便所述源对象根据所述数据匹配策略提升所述源对象与所述目标对象之间的匹配度。
2.根据权利要求1所述的数据匹配方法,其特征在于,还包括获取所述条件特征向量的步骤:
获取与所述目标对象匹配的多个其他对象的多个样本数据集合,以构建多个样本特征向量;
基于所述多个样本特征向量,通过均值计算得到所述条件特征向量。
3.根据权利要求1所述的数据匹配方法,其特征在于,所述根据所述源对象特征向量与条件特征向量,生成所述源对象和目标对象之间的数据匹配策略,包括:
根据所述源对象特征向量与所述条件特征向量,通过以下公式计算所述源对象和目标对象之间的余弦相似度:
其中,cos(θ)为所述源对象和目标对象之间的余弦相似度;Ai表示所述源对象特征向量中的第i个元素的值,Bi表示条件特征向量中的第i个元素的值,n为特征向量中的元素数量。
4.根据权利要求1所述的数据匹配方法,其特征在于,还包括获取所述源对象特征向量中的每个源对象特征参数的步骤:
获取所述目标对象匹配的多个其他源对象的多个样本数据集合;
根据所述多个样本数据集合得到多个特征列,每个特征列由同一个样本特征对应的多个样本原始数据构成;
对各个源对象原始数据在对应的特征列中进行数据排序;及
根据各个源对象原始数据在对应特征列中的数据排序结果,将所述各个源对象原始数据转换为对应的源对象特征参数,所述源对象特征参数用于构建所述源对象特征向量。
5.根据权利要求4所述的数据匹配方法,其特征在于,所述根据各个源对象原始数据在对应特征列中的数据排序结果,将所述各个源对象原始数据转换为对应的源对象特征参数,包括:
根据所述数据排序结果,得到所述各个源对象的各个样本特征在对应特征列中的排名百分比gi;
根据所述排名百分比计算各个源对象的各个样本特征对应的特征参数hi,公式如下:
hi=a*(1-gi);
其中,i表示各个源对象的第i个样本特征,hi表示各个源对象在第i个样本特征的特征参数,gi表示各个源对象的第i个样本特征在第i个特征列中的排名百分比,a表示数值常量。
6.根据权利要求5所述的数据匹配方法,其特征在于,所述根据所述源对象特征向量与条件特征向量,生成所述源对象和目标对象之间的数据匹配策略,包括:
根据各个源对象的各个样本特征对应的特征参数hi,计算各个源对象的各个样本特征对应的偏差值di,公式如下:
其中,i表示各个源对象的第i个样本特征,hi表示各个源对象的第i个样本特征的特征参数,fi表示第i个特征列中的多个特征参数的平均值,xi表示第i个特征列中的多个特征参数的标准差,b、c均表示数值常量;
根据各个源对象的各个样本特征对应的偏差值di,生成针对第i个样本特征对应的策略数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910872804.3/1.html,转载请声明来源钻瓜专利网。