[发明专利]帐号分析方法、装置及存储介质在审
申请号: | 201810642346.X | 申请日: | 2018-06-21 |
公开(公告)号: | CN108805580A | 公开(公告)日: | 2018-11-13 |
发明(设计)人: | 李凤辉 | 申请(专利权)人: | 上海银赛计算机科技有限公司 |
主分类号: | G06Q20/40 | 分类号: | G06Q20/40 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 祝亚男 |
地址: | 200125 上海市青浦区*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 决策树模型 预设 分析 存储介质 机器学习领域 分析效率 交易记录 金融产品 预设时长 训练集 预测 输出 金融 | ||
1.一种帐号分析方法,其特征在于,应用于服务器中,所述方法包括:
获取所述待分析帐号在最近预设时长内的金融产品交易记录,所述金融产品交易记录为对金融产品进行买入或者卖出时产生的记录;
确定所述待分析帐号的帐号数据,所述帐号数据中包括所述金融产品交易记录;
将所述帐号数据输入预设决策树模型,所述预设决策树模型是通过预设训练集训练得到的模型;所述预设训练集中包括风险帐号和非风险帐号,以及与所述风险帐号和所述非风险帐号对应的帐号数据,所述风险帐号为通过非正当方式进行套利的帐号;
通过所述预设决策树模型输出得到所述待分析帐号的风险情况,所述风险情况用于指示所述待分析帐号是否为风险帐号。
2.根据权利要求1所述的方法,其特征在于,所述获取所述待分析帐号在最近预设时长内的金融产品交易记录之后,还包括:
根据所述金融产品交易记录获取相对数据,所述相对数据用于反应所述金融产品交易记录针对所述最近预设时长的平均数占最大累计出入金的比值;
所述确定所述待分析帐号的帐号数据,所述帐号数据中包括所述金融产品交易记录,包括:
所述确定所述待分析帐号的帐号数据,所述帐号数据中包括所述金融产品交易记录和所述相对数据。
3.根据权利要求2所述的方法,其特征在于,所述根据所述金融产品交易记录获取所述相对数据,包括:
当所述金融产品交易记录中包括总成交额、交易天数以及所述最大累计出入金时,根据所述总成交额与所述交易天数的比值得到日均成交额,根据所述日均成交额与所述最大累计出入金的比值得到所述相对数据;
和/或,
当所述金融产品交易记录中包括总交易费用、所述交易天数以及所述最大累计出入金时,根据所述总交易费用与所述交易天数的比值得到日均交易费用,根据所述日均交易费用与所述最大累计出入金的比值得到所述相对数据。
4.根据权利要求1至3任一所述的方法,其特征在于,所述将所述帐号数据输入预设决策树模型之前,还包括:
获取训练集,所述训练集用于对待训练决策树模型进行训练,所述训练集包括标注有所述风险情况的风险帐号和非风险帐号,以及与所述风险帐号和所述非风险帐号对应的帐号数据;
根据所述训练集对所述待训练决策树模型进行训练,得到所述预设决策树模型。
5.根据权利要求4所述的方法,其特征在于,所述获取训练集,包括:
获取初始训练集,所述初始训练集中包括p个风险帐号和q个非风险帐号,p≤q;
对所述初始训练集中的q个非风险帐号进行下采样,得到n个非风险帐号,所述下采样是指使采样后的非风险帐号的数量少于采样前的非风险帐号的数量的采样方式,q≥n;
根据所述n个非风险帐号和所述p个风险帐号确定所述训练集。
6.根据权利要求4所述的方法,其特征在于,所述获取训练集,包括:
获取初始训练集,所述初始训练集中包括p个风险帐号和q个非风险帐号,p≤q;
对所述初始训练集中的p个风险帐号进行上采样,得到m个风险帐号,所述上采样是指使采样后的风险帐号的数量多于采样前的风险帐号的数量的采样方式,p≤m;
根据所述q个非风险帐号和所述m个风险帐号确定所述训练集。
7.根据权利要求5所述的方法,其特征在于,所述对所述初始训练集中的q个非风险帐号进行下采样,得到n个非风险帐号,包括:
获取所述q个非风险帐号的最大累计出入金;
将所述q个非风险帐号按所述最大累计出入金的r个阈值范围进行归类,其中,r≥1;
依次循环根据所述r个阈值范围内选取一次非风险帐号,直至选取出所述n个非风险帐号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海银赛计算机科技有限公司,未经上海银赛计算机科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810642346.X/1.html,转载请声明来源钻瓜专利网。