[发明专利]一种基于多维度数据学习的金融机构潜在客户推荐方法在审
申请号: | 202011140311.X | 申请日: | 2020-10-22 |
公开(公告)号: | CN112256964A | 公开(公告)日: | 2021-01-22 |
发明(设计)人: | 钱鹰;安春生;陈雪;姜美兰;宋阳;张蓝;刘娟;张化友 | 申请(专利权)人: | 重庆邮电大学;重庆市住房公积金管理中心 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/951;G06K9/62;G06N3/08 |
代理公司: | 北京同恒源知识产权代理有限公司 11275 | 代理人: | 赵荣之 |
地址: | 400065 *** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 多维 度数 学习 金融机构 潜在 客户 推荐 方法 | ||
1.一种基于多维度数据学习的金融机构潜在客户推荐方法,其特征在于:该方法包括以下步骤:
S1:数据获取模块获取多维样本数据,包括公积金数据和工商局数据,根据预设的数据结构将所述的多维数据建立数据集并存储,得到初始数据集;
S2:数据处理,对初始数据集进行去除唯一属性处理、缺失值处理、异常值处理和数据标准化处理,得到清理数据集;
S3:数据筛选对清理数据集进行降维,得到客户最主要的特征,将最主要的特征提取出来,形成筛选数据集;
S4:等级预测将筛选数据集放到推荐模型中,推荐模型给出每个客户的等级预测;
S5:客户推荐根据每个客户的等级预测,对某些客户进行产品推广。
2.根据权利要求1所述的一种基于多维度数据学习的金融机构潜在客户推荐方法,其特征在于:所述对初始数据集进行去除唯一属性处理具体为:
S211:通过初始数据集分析,找到每个客户的唯一属性,包括组织机构代码和身份证号等;
S212:对唯一值属性进行剔除。
3.根据权利要求1所述的一种基于多维度数据学习的金融机构潜在客户推荐方法,其特征在于:所述缺失值处理具体为:
S221:利用公式对初始数据集进行均值计算,得到初始数据集中每个特征的平均值;其中x代表到初始数据集中每个特征的平均值,x1,x2……xn代表每个特征的样本值,n代表每个特征的样本数量;
S222:将缺失值替换为平均值。
4.根据权利要求1所述的一种基于多维度数据学习的金融机构潜在客户推荐方法,其特征在于:所述异常值处理具体为:
S231:利用公式计算初始数据集每个特征的均值,其中,h1,h2……h代表样本值,n代表样本数,h代表初始数据集每个特征的平均值;
S232:假设初始数据集X为n行n列:使用公式对数据集进行中心化,其中,a1,a2……an代表初始数据集的某个特征,b1,b2……bn,y1,y2……yn同理,h1,h2……hn代表S231中所求的每个特征的均值,Y代表中心化后的数据;
S233:利用公式求得协方差矩阵∑,其中n代表样本数,Y代表中心化后的数据集;
S234:利用计算马氏距离,得到任意两个样本x,y之间的距离;其中x,y代表两个不同的样本,∑代表S233计算出来的方差;
S235:对马氏距离进行升序排序,假设得到的结果为[a,b,c……],其中a马氏距离计算后的最小距离;
S236:通过公式threshold=a(m-ceil(m*0.02))设定要剔除样本的阈值,其中a为步骤五计算出来的马氏距离的最小距离,m代表每个特征的样本数量;
S237:当d(x,y)threshold则判断数据为正常值,不对其进行操作;当d(x,y)threshold则判断数据为异常值,要对其进行提剔除。
5.根据权利要求1所述的一种基于多维度数据学习的金融机构潜在客户推荐方法,其特征在于:所述数据标准化处理具体为:
S241:通过排序得到特征的最大值和最小值,假设得到的结果为[min……max]
S242:通过公式将数据进行(max-min)标准化,得到值在[0,1]之间的数据;其中max,min为S241求出的最大值和最小值,x为某特征的样本值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学;重庆市住房公积金管理中心,未经重庆邮电大学;重庆市住房公积金管理中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011140311.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种乙烯储存设备
- 下一篇:机场专用的跑道防侵入智能管理系统和方法