[发明专利]一种APP2VEC在风控系统中建模的工作方法在审
申请号: | 202110360358.5 | 申请日: | 2021-04-02 |
公开(公告)号: | CN113034193A | 公开(公告)日: | 2021-06-25 |
发明(设计)人: | 徐宇杰 | 申请(专利权)人: | 墨致科技(上海)有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06F16/35;G06K9/62;G06N20/00 |
代理公司: | 广东省畅欣知识产权代理事务所(普通合伙) 44631 | 代理人: | 耿佳 |
地址: | 200030 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 app2vec 系统 建模 工作 方法 | ||
一种APP2VEC在风控系统中建模的工作方法,通过将整理多个用户一个月之内使用app的行为的数据进行训练集,配合工具fasttext训练生成skip‑gram模型得到n维向量模型,并且通过softmax的算法将需要聚合的向量矩阵压缩成一个一维多列的向量特征;选取风控样本用户一个月之内使用app的行为数据进行聚合,再将数组数据累加起来,得到1×100的向量;把1×100的向量作为特征,进行训练并建立风控模型;该方法将训练向量模型时训练集的准备,以及在向量使用过程中向量之间的累加方法,通过使用本发明生成的特征,在模型训练的过程中,挑选出带来增益的特征变量;使上万维和app使用相关的特征压缩成一个200至300维的向量,通过这些向量,可以很好的概括形容用户一段时间内使用app的行为。
技术领域
本发明涉及系统建模方法领域,具体是一种APP2VEC在风控系统中建模的工作方法。
背景技术
科技信息化时代的今天,移动互联网带给人们的方方面面方便和快捷,智能手机作为移动互联网的载体每天会产生数以百亿量级的行为。我们可以通过这些用户手机使用行为分析,更准确的进行用户定位,生成用户画像,从而判断用户在金融领域的风险;
一般来说可以从两个方面进行分析,一个是用户的手机app使用行为,比如一天之内具体打开使用app的时间,每天打开各个app的时长、次数。通过这些数据生成向量特征并且建立模型,可以预测用户的兴趣,职业,性别,金融风险等,同时也可以概括用户一段时间内的app使用情况。
目前现有的技术方案比较适合于广告投放场景,在金融风控领域缺少实际的方案。本次申请的专利主要是把app2vec的技术运用于金融场景,结合风控知识,生成出给风控模型带来增益的特征变量。一般来说,同一个特征在不同场景下的不同模型里,带来的信息熵不同。比如在广告营销模型中,一个用户A同一天使用多个贷款类app这种行为,对于一个广告平台来说,可以预测其对贷款的兴趣大于没有使用过任何贷款类app的用户B,那对用户A展示广告被点击的几率就会大于用户B。 而在金融风控领域,我们会觉得用户A的风险比用户B高,用户A有多头借贷的风险。 所以同一个特征变量(一天内使用贷款app的个数)在不同领域起到的作用不同,这很大程度上取决于建模人员对业务的理解。所以如果对业务了解不深刻,很难在海量的特征变量中挑选出对实际业务带来增益的特征。类似对于用户的兴趣或者风险的评估,并不仅限于贷款类app的使用,可以应用在很多其他的领域。
发明内容
本发明所要解决的技术问题是提供一种APP2VEC在风控系统中建模的工作方法,可以有效解决上述背景技术中提出的问题。
为解决上述问题,本发明所采取的技术方案是:一种APP2VEC在风控系统中建模的工作方法,其方法在于:
步骤一:选取多个用户一段时间内使用app的行为数据;
步骤二:把用户ID、app名称、使用时间的数据进行扁平化整理成统一格式;
步骤三:把用户ID按天聚合,并且根据使用时间排序,得到用户一天的使用app的序列;
步骤四:把训练集中所有app名称映射成base 60编码,得到一个编码完整的训练集;
步骤五:使用快速文本分类算法fasttext skipgram 在已有的训练集上进行训练,调参并生成向量模型;
步骤六:把编码还原成app名称;
步骤七:选取风控样本用户一段时间内使用app的行为数据,每个app名映射成一个100维度向量;
步骤八:把步骤七选取的数据按人聚合,得到一个用户该时间内使用app 的100维向量数组,以及该时间段内每个app使用的次数数组;
步骤九:把步骤八产出的数据累加起来,得到1×100的向量;
步骤十:把1×100的向量作为特征,进行训练并建立风控模型。
作为本发明的进一步优选方案,所述步骤三中用户一天内使用2个app之间的间隔大于2小时,在这2个app之间的序列数据中每过2小时补1个z。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于墨致科技(上海)有限公司,未经墨致科技(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110360358.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于头戴计算机的远程连续指导方法
- 下一篇:一种太阳能板