[发明专利]一种实现个性化推荐的方法及装置有效
申请号: | 201910759846.6 | 申请日: | 2019-08-16 |
公开(公告)号: | CN110457329B | 公开(公告)日: | 2022-05-06 |
发明(设计)人: | 刘正夫;程秋建;张孝丹;周振华;伍思恒 | 申请(专利权)人: | 第四范式(北京)技术有限公司 |
主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/2458;G06F16/9535;G06N20/00 |
代理公司: | 北京铭硕知识产权代理有限公司 11286 | 代理人: | 苏银虹;曾世骁 |
地址: | 100085 北京市海淀区上*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 实现 个性化 推荐 方法 装置 | ||
1.一种实现个性化推荐的方法,其特征在于,包括:
获取数据源,其中,所述数据源包括多个数据表,各数据表均具有其各自的类别;
确定所述数据源中的多个数据表的嵌套层级数N,依次对每个嵌套层级执行如下步骤:从所述数据源中,确定当前嵌套层级的目标数据表;对所述目标数据表以及所述数据源中与所述目标数据表存在对应关系的数据表,进行深度特征提取,并将提取的深度特征添加到所述目标数据表中,形成深度特征表;对所述深度特征表进行离散特征处理和/或窗口特征处理,形成针对所述目标数据表的特征表,并将所述特征表作为新的数据表添加到所述数据源中;N≥1;
基于第N个嵌套层级的目标数据表的特征表,进行机器学习模型训练,得到推荐模型;
利用所述推荐模型实现个性化推荐;
其中,所述从所述数据源中,确定当前嵌套层级的目标数据表,包括:
在当前嵌套层级为第一层级时,当前嵌套层级的目标数据表为用户在所述数据源中指定的数据表;
或,在当前特征嵌套层级为第M层级时,当前嵌套层级的目标数据表为上一个嵌套层级的目标数据表的前表,当前嵌套层级的目标数据表的后表为上一个嵌套层级的特征表;
或,在当前特征嵌套层级为第M层级时,当前嵌套层级的目标数据表为上一个嵌套层级的目标数据表的后表,当前嵌套层级的目标数据表的前表为上一个嵌套层级的特征表;
其中,N≥M≥2,所述前表中的一条数据对应目标数据表中的多条数据;所述后表中的多条数据对应所述目标数据表中的一条数据。
2.根据权利要求1所述的方法,其特征在于,对所述深度特征表进行离散特征处理,包括:
对所述深度特征表的至少一个离散特征进行onehot编码;
将各离散特征的onehot编码作为新特征添加到所述深度特征表中。
3.根据权利要求1或2所述的方法,其特征在于,对所述深度特征表进行离散特征处理,包括:
对所述深度特征表的至少一个离散特征中的每个离散特征,计算该离散特征取不同值时对应标签为预设值的概率值,将计算出的相应概率值添加到所述深度特征表中。
4.根据权利要求1所述的方法,其特征在于,对所述深度特征表进行窗口特征处理,包括:
基于所述深度特征表的时间特征,对所述深度特征表的至少一个连续特征进行窗口特征提取,将窗口特征添加到所述深度特征表中。
5.根据权利要求4所述的方法,其特征在于,所述基于所述深度特征表的时间特征,对所述深度特征表的至少一个连续特征进行窗口特征提取,包括:
采用预设的第一特征生成算法,对时间间隔为预设时长的两个时间特征对应的连续特征进行窗口特征提取。
6.根据权利要求1所述的方法,其特征在于,对所述目标数据表以及所述数据源中与所述目标数据表存在对应关系的数据表,进行深度特征提取,并将提取的深度特征添加到所述目标数据表中,形成深度特征表,包括:
确定与所述目标数据表存在对应关系的前表,其中,所述前表中的一条数据对应目标数据表中的多条数据;
将所述前表中的至少一个非主键对应的数据作为新特征,添加到所述目标数据表,形成所述深度特征表。
7.根据权利要求1或6所述的方法,其特征在于,对所述目标数据表以及所述数据源中与所述目标数据表存在对应关系的数据表,进行深度特征提取,并将提取的深度特征添加到所述目标数据表中,形成深度特征表,包括:
确定与所述目标数据表存在对应关系的后表,其中,所述后表中的多条数据对应所述目标数据表中的一条数据;
采用预设的第一特征生成算法对所述后表进行新特征生成,并将新特征添加到所述目标数据表,形成所述深度特征表。
8.根据权利要求7所述的方法,其特征在于,在形成所述深度特征表之前,所述方法还包括:
采用预设的第二特征生成算法对添加了新特征的目标数据表进行新特征生成,并将生成的新特征添加到所述添加了新特征的目标数据表中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于第四范式(北京)技术有限公司,未经第四范式(北京)技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910759846.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:参数生效方法及装置
- 下一篇:一种时序数据管理平台