[发明专利]一种推荐模型的训练方法和训练装置在审

申请号：	201710372373.5	申请日：	2017-05-24
公开（公告）号：	CN107273436A	公开（公告）日：	2017-10-20
发明（设计）人：	白露;杨大利;汪鑫;郭文涛	申请（专利权）人：	北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司
主分类号：	G06F17/30	分类号：	G06F17/30;G06K9/62
代理公司：	中原信达知识产权代理有限责任公司11219	代理人：	张一军,姜劲
地址：	100195 北京市海淀区杏石口路6***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种推荐模型训练方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及计算机技术领域，特别地涉及一种推荐模型的训练方法和训练装置。

背景技术

推荐是进行信息推广以使人们获取信息的一种重要途径，应用在生活的各个方面，例如：搜索引擎的推荐、输入法输入词的推荐、网站信息的推荐、以及朋友圈的信息推荐、商品推荐等等。通过将收集的用户信息进行分析处理，进而生成推荐模型，可以更便捷、快速、准确地进行用户推荐。

以搜索引擎为例，当用户输入一个关键词时，搜索引擎即会使用根据网站记录的其他用户的搜索记录训练生产的推荐模型向该用户进行推荐，例如：当用户输入关键词“JAVA”时，搜索引擎的推荐结果可以包括“JAVA培训”、“JAVA教程”、“JAVA下载”、“JAVA环境变量设置”等等内容，以便用户进行选择，从而节省用户的输入时间，提高用户的体验。推荐模型的推荐结果将直接影响该搜索引擎的用户满意度。

以电子商务行业为例，在电子商务(简称电商)业务系统中，向用户推荐商品是可以促使用户浏览、筛选商品的一种重要途径。通过挖掘用户在电商网站上的行为动作序列以获得深层信息，推荐系统可以更精准的分析和刻画用户需求，从而及时的给用户推荐感兴趣的商品，并为商家带来更多的利润。用户动作例如包括：搜索商品信息，打开、浏览或关闭某个页面，点击页面某个位置，发表或转载评论等等。

当前电商网站中使用的商品推荐系统，大多是通过对用户在页面上的浏览、搜索、点击等行为信息进行分析后得到商品推荐方案。现有的商品推荐系统是从扩充推荐模型的训练特征的角度入手，通过人工筛选或机器统计的方法将用户的行为信息加工并转化成特征表示，连同包括页面的样式、内容、链接等等在内的页面内容、以及用户相关的个人属性信息(如：用户登陆网站的时间、地域、设备号，用户注册时所填写的个人信息等)等其他的数据特征，一并输入到排序或推荐模型中，最后得到可以推荐的商品及其排序。

在实现本发明的过程中，发明人发现现有技术存在如下技术问题：

1、目前大多数推荐系统是通过将用户行为数据作为样本的特征输入到推荐模型中以影响推荐结果，但是推荐结果是否为客户所认可，以及推荐模型是否可以更为优化却没有具体的参考标准；

2、目前的推荐系统存在数据标注稀疏和分布不平衡等问题，例如：在推荐结果中，仅有很少量的结果被用户所采纳，相对于展现量来说，采纳量很稀疏。如何有效缓解训练数据的稀疏性和不平衡性，提升推荐系统的训练效果，是一个亟待解决的问题。

发明内容

有鉴于此，本发明实施例提供一种推荐模型的训练方法和训练装置，能够将用户在推荐结果展示之后的行为作为推荐反馈，进一步地用于优化推荐模型；同时可以有效缓解训练数据中采纳量相较于推荐量上的稀疏性和正负样本比例的不平衡性。

为实现上述目的，根据本发明实施例的一个方面，提供了一种推荐模型的训练方法。

一种推荐模型的训练方法，包括：获取推荐模型的训练数据，所述训练数据为最近时段产生的数据，所述最近时段具有预定义的时长；按照预定的训练数据标注规则对所述训练数据进行标注以得到最新标注数据，其中，所述最新标注数据包括所述最近时段发生的推荐结果被展示后的用户反馈，所述用户反馈根据推荐结果被展示后的用户行为来确定；对所述最新标注数据进行训练以得到推荐模型。

可选地，按照预定的训练数据标注规则对所述训练数据进行标注以得到最新标注数据的步骤包括：从用户行为日志中读取所述最近时段中所述用户在推荐结果被展示后的用户行为的序列；对所述序列中的每个用户行为，根据预定义的计分规则，为所述用户行为对应的用户-推荐结果关系数据赋予相应的分值；使用所述分值对所述训练数据进行标注以得到所述最新标注数据。

可选地，所述用户行为的序列包括所述用户访问的推荐结果页的标识、时间、流量来源和所述用户在推荐结果详情页的动作及时间戳。

可选地，所述计分规则通过下述步骤生成：从用户行为日志中提取所述用户在推荐结果被展示后的用户行为的序列；统计所述序列中的行为特征数据以生成训练样本集，所述行为特征数据包括用户对各个推荐结果的行为及各个所述行为花费的时间和相互次序；根据推荐结果是否被采纳来对所述训练样本集进行标注；对所述标注后的训练样本集进行训练以得到所述计分规则。

可选地，统计所述序列中的行为特征数据包括：把所述序列按会话划分，并统计所述会话中的行为特征数据。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司，未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201710372373.5/2.html，转载请声明来源钻瓜专利网。

上一篇：基于MapReduce的视频人员模糊检索并行化方法
下一篇：提供与用户可能访问的地点相关的信息的方法和系统

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F17-00 特别适用于特定功能的数字计算设备或数据处理设备或数据处理方法
G06F17-10 .复杂数学运算的
G06F17-20 .处理自然语言数据的
G06F17-30 .信息检索；及其数据库结构
G06F17-40 .数据的获取和记录
G06F17-50 .计算机辅助设计

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种推荐模型的训练方法和训练装置在审

专利文献下载