[发明专利]端到端深度协作过滤有效
申请号: | 201680075923.0 | 申请日: | 2016-12-23 |
公开(公告)号: | CN108431833B | 公开(公告)日: | 2022-09-16 |
发明(设计)人: | M·沃尔克弗斯;T·J·鲍塔南 | 申请(专利权)人: | 多伦多道明银行 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06N5/02 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 王茂华 |
地址: | 加拿大*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 端到端 深度 协作 过滤 | ||
推荐系统使用预测用户对在线系统中的项的偏好的一个或多个神经网络模型来为在线系统生成推荐。神经网络模型生成用户和项的隐表示,其可以被组合以确定用户对项的预期偏好。通过使用神经网络模型,推荐系统可以实时生成针对新用户和项的预测,而无需重新校准模型。此外,推荐系统可以容易地并入除了偏好信息之外的其他形式的信息,以通过包括附加信息来生成用户或项的隐描述从而生成改进的偏好预测。
背景技术
本发明一般涉及生成推荐,并且更具体地涉及为在线系统的用户生成推荐。
在线系统管理并提供各种项给在线系统的用户以供用户与之交互。当用户与内容项交互时,用户可以表达或揭示超越其他项的对某些项的偏好。这些项可以是娱乐内容项,诸如视频、音乐或书籍,或其他类型的内容,诸如学术论文、电子商务(e商务)产品。许多在线系统包括向用户建议相关项以供考虑的推荐系统是有利的。推荐系统可以通过建议用户可能感兴趣或将与之交互的内容来提高用户与在线系统交互的频率和质量。例如,包括在视频流式传输服务器中的推荐系统可以基于用户以前已经观看过的电影来标识和推荐用户可能喜欢的电影。
一般而言,用于推荐系统的模型使用用户和在线系统的项之间的偏好信息来预测特定用户将是否喜欢一个项。然后可以向用户建议那些被预测为对用户具有高度偏好的项以供考虑。但是,推荐系统可以在在线系统中拥有数百万的用户和项,并且还接收需要快速有效地被纳入到推荐系统中的新用户和项。而且,由于内容项的数量非常大,所以用户偏好信息是稀疏的。另外,对于在线系统针对其并没有用户偏好信息的新用户或项,应该有效地生成预测。因此,在依赖不完整或不存在的偏好信息的情况下,推荐系统需要为现有的和新的用户及项提供有效的推荐。
发明内容
推荐系统使用预测用户对在线系统中的项的偏好的一个或多个神经网络模型来为在线系统生成推荐。神经网络模型生成用户的隐表示和项的隐表示,其可以被组合以确定用户对项的预期偏好。隐表示被称为隐项向量和隐用户向量。在一个实施例中,通过诸如点积的数学公式根据隐向量(latent vector)确定预期偏好,这可以避免用于组合隐表示的更复杂技术。另外,可以使用先前的偏好信息来联合训练生成隐向量的神经网络模型以生成隐向量,数学公式为该隐向量生成偏好信息。
通过使用神经网络模型,通过模型进行正向传递以生成用户或项的隐表示(在隐向量中),推荐系统可以实时生成针对新用户和项的预测,而无需重新校准模型。此外,推荐系统可以容易地并入除了偏好信息之外的其他形式的信息,以通过包括附加信息来生成用户或项的隐向量描述从而生成改进的偏好预测。在一个实施例中,这些包括用户和项的特性。
在一个实施例中,推荐系统将用户表征为一组用户描述符,并将项表征为一组项描述符。用户描述符和项描述符被用作生成隐向量的模型的输入。在一个实施例中,用户描述符包括从指示用户对一个或多个其他项的偏好的已知偏好信息中所标识的用户偏好向量,以及指示诸如年龄、性别、兴趣或其他特征之类的用户的特性的用户内容向量。项描述符包括从指示一个或多个其他用户对该项的偏好的已知偏好信息中所标识的项偏好向量,以及描述项的特性的项内容向量。项的特性可以取决于项的类型。因此,以项内容向量表征的针对电影的特性可以描述电影的片名、电影中的男演员和女演员的名字、电影中的主题、电影的概要等。
在一个实施例中,用户描述符还包括描述对于用户而言存在偏好信息的项的已评级项向量。已评级项向量允许推荐系统根据用户对其的偏好已知的项来表示用户。项描述符还可以包括描述对项进行评级的用户的评级用户向量。评级用户向量允许推荐系统根据与针对项的偏好信息相关联的用户来表示项。
在一个实施例中,提取描述符以使得项偏好向量具有与用户偏好向量相同的长度,项内容向量具有与已评级项向量相同的维度,并且用户内容向量具有与评级用户向量相同的长度。作为一个示例,可以通过将项偏好向量标识为跨越在线系统的不同用户的针对该项的偏好列表,并且将用户偏好向量标识为用户对其具有偏好信息的项的偏好列表的加权总和,来生成针对特定用户和项的相同长度的用户和项偏好向量。所得到的用户和项偏好向量包含特定用户和项二者的偏好信息,同时具有与在线系统中的用户数量相关的相同长度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于多伦多道明银行,未经多伦多道明银行许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201680075923.0/2.html,转载请声明来源钻瓜专利网。