[发明专利]训练推荐模型的方法、装置及推荐系统有效
申请号: | 201610011669.X | 申请日: | 2016-01-08 |
公开(公告)号: | CN105589971B | 公开(公告)日: | 2018-12-18 |
发明(设计)人: | 王亚龙 | 申请(专利权)人: | 车智互联(北京)科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京思睿峰知识产权代理有限公司 11396 | 代理人: | 赵爱军;谢建云 |
地址: | 100080 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了训练推荐模型的方法、装置及推荐系统。其中,训练推荐模型的装置包括日志获取单元、第一特征提取单元、第二特征提取单元、样本生成单元、样本聚合单元和模型训练单元。日志获取单元适于获取多条访问日志。第一特征提取单元适于从每条访问日志中提取用于标识其对应的页面所呈现的推荐信息的第一特征,并且提取用于标识该页面上下文信息的第二特征。第二特征提取单元适于获取每条访问日志所关联的用户对各种推荐信息的兴趣度排序值,并查询与这条访问日志对应页面所呈现的推荐信息对应的兴趣度排序值作为第三特征。 | ||
搜索关键词: | 训练 推荐 模型 方法 装置 系统 | ||
【主权项】:
1.一种训练推荐模型的方法,包括:获取多条访问日志,其中每条访问日志是对用户访问页面操作的数据记录,每次用户所访问的页面适于呈现推荐信息,每条访问日志包括用于标识用户对所访问页面中推荐信息的点击次数;从每条访问日志中提取用于标识其对应的页面所呈现的推荐信息的第一特征,并且提取用于标识该页面上下文信息的第二特征;获取每条访问日志所关联的用户对各种推荐信息的兴趣度排序值,并查询与这条访问日志对应页面所呈现的推荐信息对应的兴趣度排序值作为第三特征;将每条访问日志对应的点击次数、第一特征、第二特征和第三特征合并为一条第一样本数据;将第一特征、第二特征和第三特征相同的第一样本数据归类为一组样本,并将每组样本聚合为一条第二样本数据,其中每条第二样本数据包括其所对应一组样本的样本总数和点击总次数;根据采样率选定预定数量的点击总次数为0的第二样本数据;从所选定数据中随机选择一条第二样本数据进行保留,并删除所选定数据中其余的第二样本数据,以及将所保留这条第二样本数据中样本总数更新为对所选定数据中每个第二样本数据的样本总数进行累计之和;以及利用所述第二样本数据对推荐模型进行参数训练操作,以获取所述第一特征、第二特征和第三特征中每一个特征项的参数值。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于车智互联(北京)科技有限公司,未经车智互联(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610011669.X/,转载请声明来源钻瓜专利网。