[发明专利]一种APP2VEC在风控系统中建模的工作方法在审

专利信息
申请号: 202110360358.5 申请日: 2021-04-02
公开(公告)号: CN113034193A 公开(公告)日: 2021-06-25
发明(设计)人: 徐宇杰 申请(专利权)人: 墨致科技(上海)有限公司
主分类号: G06Q30/02 分类号: G06Q30/02;G06F16/35;G06K9/62;G06N20/00
代理公司: 广东省畅欣知识产权代理事务所(普通合伙) 44631 代理人: 耿佳
地址: 200030 上海市*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 app2vec 系统 建模 工作 方法
【说明书】:

一种APP2VEC在风控系统中建模的工作方法,通过将整理多个用户一个月之内使用app的行为的数据进行训练集,配合工具fasttext训练生成skip‑gram模型得到n维向量模型,并且通过softmax的算法将需要聚合的向量矩阵压缩成一个一维多列的向量特征;选取风控样本用户一个月之内使用app的行为数据进行聚合,再将数组数据累加起来,得到1×100的向量;把1×100的向量作为特征,进行训练并建立风控模型;该方法将训练向量模型时训练集的准备,以及在向量使用过程中向量之间的累加方法,通过使用本发明生成的特征,在模型训练的过程中,挑选出带来增益的特征变量;使上万维和app使用相关的特征压缩成一个200至300维的向量,通过这些向量,可以很好的概括形容用户一段时间内使用app的行为。

技术领域

本发明涉及系统建模方法领域,具体是一种APP2VEC在风控系统中建模的工作方法。

背景技术

科技信息化时代的今天,移动互联网带给人们的方方面面方便和快捷,智能手机作为移动互联网的载体每天会产生数以百亿量级的行为。我们可以通过这些用户手机使用行为分析,更准确的进行用户定位,生成用户画像,从而判断用户在金融领域的风险;

一般来说可以从两个方面进行分析,一个是用户的手机app使用行为,比如一天之内具体打开使用app的时间,每天打开各个app的时长、次数。通过这些数据生成向量特征并且建立模型,可以预测用户的兴趣,职业,性别,金融风险等,同时也可以概括用户一段时间内的app使用情况。

目前现有的技术方案比较适合于广告投放场景,在金融风控领域缺少实际的方案。本次申请的专利主要是把app2vec的技术运用于金融场景,结合风控知识,生成出给风控模型带来增益的特征变量。一般来说,同一个特征在不同场景下的不同模型里,带来的信息熵不同。比如在广告营销模型中,一个用户A同一天使用多个贷款类app这种行为,对于一个广告平台来说,可以预测其对贷款的兴趣大于没有使用过任何贷款类app的用户B,那对用户A展示广告被点击的几率就会大于用户B。 而在金融风控领域,我们会觉得用户A的风险比用户B高,用户A有多头借贷的风险。 所以同一个特征变量(一天内使用贷款app的个数)在不同领域起到的作用不同,这很大程度上取决于建模人员对业务的理解。所以如果对业务了解不深刻,很难在海量的特征变量中挑选出对实际业务带来增益的特征。类似对于用户的兴趣或者风险的评估,并不仅限于贷款类app的使用,可以应用在很多其他的领域。

发明内容

本发明所要解决的技术问题是提供一种APP2VEC在风控系统中建模的工作方法,可以有效解决上述背景技术中提出的问题。

为解决上述问题,本发明所采取的技术方案是:一种APP2VEC在风控系统中建模的工作方法,其方法在于:

步骤一:选取多个用户一段时间内使用app的行为数据;

步骤二:把用户ID、app名称、使用时间的数据进行扁平化整理成统一格式;

步骤三:把用户ID按天聚合,并且根据使用时间排序,得到用户一天的使用app的序列;

步骤四:把训练集中所有app名称映射成base 60编码,得到一个编码完整的训练集;

步骤五:使用快速文本分类算法fasttext skipgram 在已有的训练集上进行训练,调参并生成向量模型;

步骤六:把编码还原成app名称;

步骤七:选取风控样本用户一段时间内使用app的行为数据,每个app名映射成一个100维度向量;

步骤八:把步骤七选取的数据按人聚合,得到一个用户该时间内使用app 的100维向量数组,以及该时间段内每个app使用的次数数组;

步骤九:把步骤八产出的数据累加起来,得到1×100的向量;

步骤十:把1×100的向量作为特征,进行训练并建立风控模型。

作为本发明的进一步优选方案,所述步骤三中用户一天内使用2个app之间的间隔大于2小时,在这2个app之间的序列数据中每过2小时补1个z。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于墨致科技(上海)有限公司,未经墨致科技(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110360358.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top