[发明专利]一种基于偏向性特征的属性预测方法在审
申请号: | 202010990516.0 | 申请日: | 2020-09-19 |
公开(公告)号: | CN112132209A | 公开(公告)日: | 2020-12-25 |
发明(设计)人: | 李玲;李嘉懿;任永亮;贺同路;杨菲;郭学栋 | 申请(专利权)人: | 北京智能工场科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q30/02 |
代理公司: | 北京君莫知识产权代理事务所(普通合伙) 11715 | 代理人: | 王凝 |
地址: | 100083 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 偏向 特征 属性 预测 方法 | ||
本发明提出一种基于偏向性特征的属性预测方法,包括数据获取阶段、数据清洗阶段、数据特征提取阶段、模型训练阶段以及模型预测阶段。数据获取阶段获取和实体属性相关的历史行为数据,数据特征提取阶段从历史行为数据中提取特征数据,模型训练阶段根据所述数据特征提取阶段得到的偏向性特征数据作为模型的输入,通过模型来学习输入特征和输出属性之间的映射关系;模型预测阶段基于所述模型训练阶段得到的最优化模型进行属性预测。所述属性预测包括基于所述历史行为数据输入所述最优化模型预测用户的性别以及对应的潜在购买目标。本发明的技术方案获取得到的信息覆盖率和准确率均具备代表性,能够较好的实现属性预测。
技术领域
本发明属于大数据预测与匹配技术领域,尤其涉及一种基于偏向性特征的属性预测方法。
背景技术
在互联网领域中,无论是电商、金融、O2O等各种场景中如何更好的理解描述各个参与的主体,都是极为重要的课题。随着大数据技术的不断深入,越来越多企业都聚焦于使用大数据来提升各种商业行为的效率,如精准营销、个性化推荐、体验优化等。这些都需要我们能够更加深入的对各个实体进行细致的刻画。以用户实体为例,其属性包括人口属性、行为轨迹、兴趣爱好、消费偏好等。现有技术中通过基本资料填写的方式获取得到的信息往往覆盖率和准确率都得不到保证。因此通过机器学习的方法对实体的属性进行预测显得尤为重要。
现有技术中,如专利CN201610486432.7中公开了一种基于安装包列表的移动用户性别预测方法,其中在将安装包列表转化成特征时提到通过结合性别比例及不同性别下安装包安装数量的比例作为特征值,在模型选择中使用决策树来进行最终性别预测。
此外,申请号为CN201611241540的中国发明专利申请提出一种地图围栏匹配方法,本方法包括获取用户输入地址信息中的地址关键词;确定所述地址关键词所在的位置区域;获取所述位置区域中用户的行为数据;通过对所述行为数据进行用户行为偏向性的匹配计算,获取用户的基本属性。通过用户输入地址信息确认位置区域,从而可以获取所述区域内的行为数据,和现有技术中常用的LBS定位相比,不但适用于获取用户当前的数据信息,还可以获取用户历史的行为数据;其次,通过对用户行为数据进行偏向性的匹配计算,获取用户的基本属性。相比较现有技术中根据用户行为数据中关键词来判断用户的基本属性相比,提高了准确度。
然而,上述方法有以下不足,第一该方法仅仅局限于解决二分类问题。第二模型选择上较为固定没有提供太多模型参考。第三该方法在特征提取方面,提出的特征值提取方法缺少理论依据,忽略了在数据中类别的先验分布对特征值提取的影响。
发明内容
为解决上述技术问题,本发明提出一种基于偏向性特征的属性预测方法,包括数据获取阶段、数据清洗阶段、数据特征提取阶段、模型训练阶段以及模型预测阶段。数据获取阶段获取和实体属性相关的历史行为数据,数据特征提取阶段从历史行为数据中提取特征数据,模型训练阶段根据所述数据特征提取阶段得到的偏向性特征数据作为模型的输入,通过模型来学习输入特征和输出属性之间的映射关系;模型预测阶段基于所述模型训练阶段得到的最优化模型进行属性预测。所述属性预测包括基于所述历史行为数据输入所述最优化模型预测用户的性别以及对应的潜在购买目标。本发明的技术方案获取得到的信息覆盖率和准确率均具备代表性,能够较好的实现属性预测。
具体而言,本发明提出的一种基于偏向性特征的属性预测方法,包括数据获取阶段、数据清洗阶段、数据特征提取阶段、模型训练阶段以及模型预测阶段。
所述数据获取阶段,用于获取和实体属性相关的历史行为数据,所述实体属性包括实体的自然属性和社会属性;
所述数据清洗阶段,用于所述数据获取阶段获取的所述历史行为数据进行数据清洗操作,数据清洗操作包括缺失值处理、重复数据处理、数据的合法性处理;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京智能工场科技有限公司,未经北京智能工场科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010990516.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种离合器检测用拆装实验台的防护装置
- 下一篇:组合式迷宫紊流螺旋泵