[发明专利]一种基于随机森林算法的金融产品实时推荐方法在审
申请号: | 201710782181.1 | 申请日: | 2017-09-02 |
公开(公告)号: | CN107507068A | 公开(公告)日: | 2017-12-22 |
发明(设计)人: | 陈涛;黄卓凡;张志聪;李笋;林志广 | 申请(专利权)人: | 广东奡风科技股份有限公司 |
主分类号: | G06Q30/06 | 分类号: | G06Q30/06;G06Q40/04 |
代理公司: | 东莞市神州众达专利商标事务所(普通合伙)44251 | 代理人: | 陈世洪 |
地址: | 510000 广东省广州市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 随机 森林 算法 金融 产品 实时 推荐 方法 | ||
1.一种基于随机森林算法的金融产品实时推荐方法,其中随机森林算法是基于银行交易和客户特征数据,其特征在于:该方法包括以下步骤:
S1)分析和整理用户的历史交易数据;
S2)分析和整理用户基本特征数据;
S3)将用户的历史交易数据和基本特征数据整合成为特征宽表;
S4)利用随机森算法对S3)得到的用户特征建立预测模型;
S5)对于新客户或存量客户,将其特征输入模型,通过预测模型实时预测其最有可能购买的金融产品。
2.根据权利要求1所述的基于随机森林算法的金融产品实时推荐方法,其特征在于:S3)中将用户的历史交易数据和基本特征数据整合为宽表的方法包括以下步骤:
(S31)选取所有用户一段时间的交易记录,整理出所有用户在该时间段内的最后一次交易记录,记为{ID, Y};
(S32)选取用户基本特征数据,记为{ID, X};
(S33)合并用户交易数据和用户基本特征数据,形成特征宽表{ID, X, Y};
其中,所述ID为用户的编号,所述Y为用户购买过的金融产品代号{Y1, Y2, ……, Ym},所述X为用户基本特征数据{X1, X2, ……, Xn}。
3.根据权利要求2所述的基于随机森林算法的金融产品实时推荐方法,其特征在于:所述S4)构建预测模型的方法包括以下步骤:
(S41)从用户特征宽表中随机选取90%、10%的数据{X, Y}分别作为训练集和测试集;
(S42)利用随机森林算法在训练集上建立预测模型;
(S43)利用测试集对预测模型进行一次测试,计算本次模型测试的精确度a;
(S44)采用N倍交叉验证方法,对(1)-(3)重复N次;
(S45)计算模型的精确度A;
其中,所述44)中的精确度a为测试集中Yi=1(i=1,2,…,m)的购买产品客户数与模型预测Yi=1(i=1,2,…,m)的潜在客户数之比;所述45)中的精确度A为N次重复试验结果a1, a2, ……, aN的均值,即A=(a1+a2+…+aN)/N。
4.根据权利要求3所述的基于随机森林算法的金融产品实时推荐方法,其特征在于:S42)在训练集上建立随机森林预测模型的方法包括以下步骤:
S421)从训练集中,应用bootstrap方法有放回地随机抽取k个新的自助样本集,样本集大小为n,本发明中n与训练集样本的数量相同,k为200;
S422)对每个自助样本集进行列采样,列数目为q,q=Sqrt(Q),其中Q为特征数量;
S423)对采样之后的数据使用完全分裂的方式建立出决策树,分裂的办法采用基尼指数
;
其中c表示数据集中类别的数量,pi表示类别 i 样本数量占所有样本的比例;
S424)将分裂完成的所有决策树组合成随机森林。
5.根据权利要求4所述的基于随机森林算法的金融产品实时推荐方法,其特征在于:所述S5)对新客户和存量客户进行产品购买的预测包括以下步骤:
(S51)将新用户或存量客户的特征X输入随机森林预测模型;
(S52)使用训练好的随机森林进行预测;随机森林算法中,当输入样本时,每一棵树均给出一个预测结果,将所有t棵树得出预测结果为Yi(i=1,2,…,n)的数量分别相加,对所有Yi按大小进行排序,选择数量最大的Yi作为结果输出,则该客户可能购买的产品为MAX{Yi}。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东奡风科技股份有限公司,未经广东奡风科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710782181.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种在网页上展示产品图片的方法
- 下一篇:一种智能衣服定制系统