[发明专利]一种筛选用户特征的方法及装置在审
申请号: | 201510920426.3 | 申请日: | 2015-12-11 |
公开(公告)号: | CN106874286A | 公开(公告)日: | 2017-06-20 |
发明(设计)人: | 杜玮;张柯;李文鹏;李屾;姜晓燕;王晓光;谢树坤;俞吴杰;朱训 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京国昊天诚知识产权代理有限公司11315 | 代理人: | 黄熊 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 筛选 用户 特征 方法 装置 | ||
本申请公开了一种筛选用户特征的方法及装置。该方法包括:提取用户特征集合,所述用户特征集合至少包含两个用户特征;针对所述用户特征集合中的每一个用户特征,以所述用户特征为因变量,所述用户特征集合中所述用户特征之外的其它用户特征为自变量,确定所述用户特征的关联因子;将用户特征集合中每一个用户特征的关联因子分别和预设阈值对比,根据对比的结果对用户特征进行筛选。从而解决了,现有技术在尽可能多的提取的用户特征之后,只能通过人工干预的方式来完成对用户特征的筛选,导致用户特征的筛选效率低的问题。
技术领域
本申请涉及机器学习技术领域,尤其涉及一种筛选用户特征的方法及装置。
背景技术
随着互联网的蓬勃发展,机器学习(Machine Learning,ML)技术作为一种新的技术,越来越受到人们的重视。机器学习技术通常用来分析和预测用户的行为,在实际应用中可以通过建立各种数学模型来实现。在数学模型的建立过程中,通常需要在网络中收集大量的用户数据,然后对这些用户数据进行分析和处理,从而提取用户数据中能够解释用户行为的用户特征,并将这些用户特征作为解释变量来建立数学模型。
然而,在对网络中收集大量的用户数据进行分析和处理,进而提取用户特征时,由于事先很难知道所要分析的用户行为会和哪些用户特征有关,因此实际应用中通常会尽可能多的提取与所要分析的用户行相关的用户特征,由于用于奖励模型的用户特征增多,从而导致建立数学模型的时间较长,并且所建立的数学模型复杂。例如用于分析用户信用的数学模型中,通常会采集用户的收入信息和学历信息,但是通常收入信息和学历信息会用较强的依赖关系,如果将它们都作为解释变量,将会使该数学模型参数的数量增多,模型的建立时间加长,并且还会对模型的性能有所影响。
现有技术在尽可能多的提取与所要分析的用户行相关的用户特征之后,只能通过人工干预的方式来完成对用户特征的筛选,从而导致用户特征的筛选效率较低。
发明内容
本申请实施例提供一种筛选用户特征的方法及装置,用于解决现有技术筛选用户特征效率低的问题。
本发明实施例提供一种筛选用户特征的方法,所述方法包括:
提取用户特征集合,所述用户特征集合至少包含两个用户特征;
针对所述用户特征集合中的每一个用户特征,以所述用户特征为因变量,所述用户特征集合中所述用户特征之外的其它用户特征为自变量,确定所述用户特征的关联因子;
将用户特征集合中每一个用户特征的关联因子分别和预设阈值对比,根据对比的结果对用户特征进行筛选。
优选的,所述将用户特征集合中每一个用户特征的关联因子分别和预设阈值对比,根据对比的结果对用户特征进行筛选具体包括:
将用户特征集合中每一个用户特征的关联因子分别和预设阈值对比,筛选出所述用户特征集合中关联因子大于预设阈值的用户特征子集合。
优选的,当筛选出的用户特征子集合中至少包含两个用户特征时,所述方法还包括:
通过用户特征子集合中每一个用户特征的标准差以及用户特征子集合中用户特征两两之间的协方差,确定用户特征子集合中用户特征两两之间的相关系数;
将所确定的每一个相关系数取绝对值并分别与预设变量对比,当所述相关系数的绝对值大于所述预设变量时,将所述相关系数以及所述相关系数对应的两个用户特征构建为关联组;
通过所构建的各个关联组,确定构建各个关联组的用户特征的特征相关分;
根据所述特征相关分,筛选出至少一个用户特征。
优选的,当特征相关分越高表示相关关系越强时,所述根据所述特征相关分,筛选出至少一个用户特征具体包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510920426.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种道路绿化用洒水车装置
- 下一篇:一种道路粉尘清洁装置