[发明专利]一种挖掘潜在客户的数学模型有效
申请号: | 201710567894.6 | 申请日: | 2017-07-13 |
公开(公告)号: | CN109255638B | 公开(公告)日: | 2022-04-26 |
发明(设计)人: | 廖继全 | 申请(专利权)人: | 北京融和友信科技股份有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06Q40/06 |
代理公司: | 北京艾格律诗专利代理有限公司 11924 | 代理人: | 谢毅 |
地址: | 100103 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 挖掘 潜在 客户 数学模型 | ||
1.一种挖掘潜在客户的方法,其特征在于,预先定义客户C,产品I,购买金额y,预测购买金额,其主要包括以下步骤:
S1)数据库取数,通过在银行存量客户的信息汇总的数据库中读取客户信息数据;
S2)数据预处理过程,所述数据预处理过程,其包括客户特征筛选、数据清洗和数据治理过程,最终输出符合要求的数据作为训练数据;训练数据Train={C1,C2,C3,Cm,.....Cn}T,训练数据的特征和购买金额构成矩阵;
S3)理财产品的各个子模型单独进行分布式计算:通过不断调整各特征权重使得预测值不断逼近真实值的过程,其包括数学模型、比较器、触发器、权重调配和输出子模型;具体步骤如下:包括依次完成数学模型、比较器、触发器、权重调配,最后获得预测子模型,构成完整的迭代优化过程,其中核心部分是数学模型:
S31)数学模型中设置多个模型:
子模型1,核心数学模型是多元非线性回归模型:
,C为常数;
且max{i,j,k,...}=3;
子模型2,核心数学模型是:
z=w1x1+w2x2+w3x3+…+wmxm,,i≤2;
子模型3,核心数学模型是:
z=w1x1+w2x2+w3x3+…+wmxm,;
S32)比较器部分:比较器是一个衡量预测值和真实购买金额y之间误差程度的函数:
S33)触发器部分:触发器的作用是人工设置一个参数α,当e≤α,停止迭代输出当前数学模型为子模型;当e>α,调整权重,不断进行迭代直到符合要求;
S34)权重调配过程:权重调配的作用是通过调节权重来控制预测值,使其不断逼近真实值;权重调配方法使用考梯度下降法;
S35)获得预测子模型部分:分别采用子模型1、子模型2、子模型3进行依次通过比较器、触发器、权重分配进行训练,三个子模型训练同时进行,当各自满足触发条件,则输出当前的三个子模型称为预测子模型;
S4)各子模型进行比较,表现突出者作为对应产品的预测模型输出,用于测试数据测试,并作为最终的全量数据预测模型,其他子模型舍弃;
S5)从数据库中另取和训练数据同等规模的有销售数据的数据,进行步骤S2操作,获得测试数据Test={C′1,C′2,C′3,.....C′n}T;将测试数据导入该产品预测模型,进行运算;
S6)通过判断测试结果是否表现突出,使用模型比较过程衡量是否突出;使用相似度、概率和衡量预测购买金额和真实购买金额y之间误差程度的函数e值来进行衡量,若测试数据的输出在相似度、概率以及e值上的表现和训练数据的最终表现符合预期,则认为该预测模型表现突出,作为全量数据的预测模型;否则,增加训练数据量重新返回步骤S2、S3、S4;
S7)对每种产品均建立预测模型,最终构建出银行所有产品的预测模块;
S8)从数据库取全量数据,进行S2操作,然后启动预测模块;
S9)获得客户C×产品预测推荐矩阵,该矩阵一方面获得产品的潜在客户名单,另一方面获得客户推荐的产品列表;
S10)根据预测推荐矩阵进行营销,并将营销结果返回数据库,启动机器学习模块,优化修正;
其中,所述客户特征筛选中并赋予初始权重包括以下步骤:
S211)根据客户特征体系建立备选特征池构成长清单;
S212)根据长清单编写问卷调查表;
S213)将问卷调查表分别发送给银行理财方面的专家以及销售人员进行调查并进行补充;
S214)将调查结果汇总取并集,获得关键特征组记为C={x1,x2,x3,.....xm};
S215)对特征组分配权重记为W=(w1,w2,w3,.....wm);
且∑w=1,作为数学模型初次迭代的初始权重;
S216)确定最终关键特征m个;
所述购买金额y和预测购买金额之间误差程度的函数:
。
2.根据权利要求1所述的一种挖掘潜在客户的方法,其特征在于,将子模型训练过程获得的三个预测子模型进行比较,表现突出者作为该产品此次机器学习的最终输出模型,用于测试数据测试,作为最终的全量数据预测模型,其他子模型舍弃,模型比较从三个维度进行比较,
其一:预测值与实际值之间余弦相似度:
,
j=1,2,3表示子模型 ;
其二:预测值等于实际值的概率:
其三:误差函数e值;
其中,三种维度的考量优先顺序为相似度>概率>e值,算法设计为:首先比较相似度,有唯一相似度最大值,则认为该预测子模型表现突出;否则,比较概率,有唯一概率最大值,则认为该预测子模型表现突出;否则,比较e值,e值最小,认为该预测子模型表现突出,若e值最小且存在相等情况,则任一均可。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京融和友信科技股份有限公司,未经北京融和友信科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710567894.6/1.html,转载请声明来源钻瓜专利网。