[发明专利]软件程序点击率预估排序方法及服务器有效
申请号: | 201610584612.9 | 申请日: | 2016-07-22 |
公开(公告)号: | CN107644042B | 公开(公告)日: | 2020-06-30 |
发明(设计)人: | 陈曦;王建明;肖京 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535 |
代理公司: | 深圳市沃德知识产权代理事务所(普通合伙) 44347 | 代理人: | 高杰;于志光 |
地址: | 518000 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 软件 程序 点击率 预估 排序 方法 服务器 | ||
一种软件程序点击率预估排序方法,包括:获取带有用户基本信息数据的软件推荐请求;将该用户基本数据转换成0、1二值变量;将转成的二值变量作为模型的特征维度代入预先生成的分析模型中,以分析出该用户对各软件的倾向分值,并基于各软件对应的倾向分值,按照预设的分析规则确定出待推荐的软件,向该用户发送推荐确定出的软件的消息。本发明还提供一种适用于上述方法的服务器。本发明可以基于用户的基本信息数据分析出用户可能感兴趣的软件。
技术领域
本发明涉及数据评估技术领域,特别是一种基于机器学习的软件程序点击率预估排序方法及服务器。
背景技术
随着互联网,特别是社会化网络的快速发展,我们正处于信息过载的时代。用户面对过量的信息很难找到自己真正感兴趣的内容,而内容提供商也很难把优质的内容准确推送给感兴趣的用户。推荐系统被认为是解决这些问题的有效方法,它对用户的历史行为进行挖掘,对用户兴趣进行建模,并对用户未来的行为进行预测,从而建立了用户和内容的关系。
目前,现有的产品推荐算法主要是针对用户是否会购买某一产品的业务场景,推荐算法的目标变量是0或1。但是对某些APP产品,我们希望能预测用户对APP上软件的点击率排序,此时的目标变量不再是0或1。现有的推荐算法难以处理目标变量非0或1的业务场景,因此,如何对APP上软件的点击率进行排序已经成为一个亟待解决的技术问题。
发明内容
鉴于以上内容,有必要提供一种软件程序点击率预估排序方法,其可以基于机器学习的方法预估软件程序点击率的排序。
一种软件程序点击率预估排序方法,包括:
获取带有用户基本信息数据的软件推荐请求;
将该用户基本数据转换成0、1二值变量;
将转成的二值变量作为模型的特征维度代入预先生成的分析模型中,以分析出该用户对各软件的倾向分值,并基于各软件对应的倾向分值,按照预设的分析规则确定出待推荐的软件,向该用户发送推荐确定出的软件的消息。
本发明较佳实施例中,所述用户基本信息数据包括用户的性别、年龄、职业、是否拥有某产品。
本发明较佳实施例中,所述将该用户基本数据转换成0、1二值变量的方法包括:基本数据中属于离散变量的采用哑变量转换方式,属于连续变量的采用分箱转换方式,以及属于缺失值的采用-1替换。
本发明较佳实施例中,所述预设的分析规则包括:
按照各软件对应的倾向分值的预设大小顺序,按顺序为各软件进行排序,确定出倾向分值大于预设值的软件作为待推荐的软件;或者
按照各软件对应的倾向分值的预设大小顺序,按顺序为各软件进行排序,若所述预设大小顺序为从大到小顺序,则确定出排序在前的预设数量的软件作为待推荐的软件,若所述预设大小顺序为从小到大顺序,则确定出排序在后的预设数量的软件作为待推荐的软件。
本发明较佳实施例中,所述分析模型的建立包括:
将预设数量用户的基本信息数据和点击各个软件的频数作为样本数据,其中,各个用户的基本信息数据作为自变量,将各个用户点击各个软件的频数作为目标变量;
取出第一预设比例的用户的样本数据作为训练集,并将剩余的用户的样本数据作为测试集;
将训练集中的各个用户的所有基本数据转成0、1二值变量,并将训练集中的各个用户的目标变量转成0、1二值变量;
计算训练集中的各个用户各特征维度与各软件的相关系数,并通过训练集中的各个用户对各软件的点击率排序训练各相关系数的权重,进而构建出基于计算出的各特征维度与各软件的相关系数及对应的权重的分析模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610584612.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:保单结算处理方法和装置
- 下一篇:网银快捷导航设置方法及系统