[发明专利]用户内容画像确定方法、访问对象推荐方法和相关装置有效
申请号: | 201810719454.2 | 申请日: | 2018-07-03 |
公开(公告)号: | CN110209875B | 公开(公告)日: | 2022-09-06 |
发明(设计)人: | 詹志征 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/73 | 分类号: | G06F16/73;G06F16/735;G06F16/2458 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 郭润湘;李娟 |
地址: | 518044 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户 内容 画像 确定 方法 访问 对象 推荐 相关 装置 | ||
本发明涉及网络数据分析及处理技术领域,公开了一种用户内容画像确定方法、访问对象推荐方法和相关装置。本发明提供的方法及装置中,根据获取到的用户行为数据,确定用于表征用户特征的用户主题矩阵,根据用户行为数据和访问对象的内容数据,确定用户行为主题与内容主题之间的关系矩阵,再根据用户主题矩阵和关系矩阵,确定用户的用户内容画像。采用上述方法,直接根据用户行为数据和内容数据得到表征用户行为主题与内容主题之间关系的关系矩阵,进而基于用户主题矩阵和关系矩阵确定出用户内容画像,流程简单且无需对内容数据进行人工标注,避免了现有技术中利用传统算法因需要设计复杂的累积逻辑而可能带来的过于泛化或细化问题。
技术领域
本发明涉及网络数据分析与处理技术领域,尤其涉及一种用户内容画像确定方法、访问对象推荐方法、相关装置和可读介质。
背景技术
传统的用户内容画像算法,主要累积用户对于内容喜好的画像,需要在基于行为的统计类算法的基础上设计复杂的累积逻辑,引入许多人工参数并反复调试。在内容侧画像的描述上,传统方案通常依赖内容数据粒度,而内容侧数据的标准多依赖人工,基于这一情况下,传统内容侧画像方案往往面临粒度不可控的问题;此外,传统方案建立的用户行为画像和内容画像通常是两套“语言”体系,实际应用有诸多不便。
因此,如何简化利用用户的内容数据和行为数据得到用户的用户内容画像的流程,避免传统算法因需要设计复杂的累积逻辑而可能带来的过于泛化或细化问题是需要考虑的问题。
发明内容
本发明实施例提供一种用户内容画像确定方法、访问对象推荐方法和相关装置,用以简化获得用户的用户内容画像的流程,避免因需要设计复杂的累积逻辑而可能带来的过于泛化或细化问题。
第一方面,本发明实施例提供一种用户内容画像确定方法,包括:
根据获取到的用户行为数据,确定用于表征用户特征的用户主题矩阵,所述用户行为数据为根据被访问的应用程序记录的访问对象的日志数据获取到的;
根据所述用户行为数据和访问对象的内容数据,确定用户行为主题与内容主题之间的关系矩阵,所述内容数据为根据被访问的应用程序中访问对象的属性信息获取到的;
根据所述用户主题矩阵和所述关系矩阵,确定用户的用户内容画像。
这样,本发明利用用户行为数据得到的用户主题矩阵和能够表征用户行为主图与内容主题之间的关系矩阵,将用户行为数据与内容数据关联起来,来确定用户的用户内容画像,无需设计复杂的累积逻辑,流程简单,从而避免了现有技术中因需要设计复杂的累积逻辑而可能带来的过于泛化或细化问题。
较佳地,根据获取到的用户行为数据,确定用于表征用户特征的用户主题矩阵,具体包括:
利用文档主题生成模型LDA对所述用户行为数据进行处理,确定用于表征用户特征的用户主题矩阵。
优选地,根据所述用户行为数据和访问对象的内容数据,确定用户行为主题与内容主题之间的关系矩阵,具体包括:
利用文档主题生成模型LDA分别对所述用户行为数据和所述内容数据进行处理,确定用于表征访问对象特征的第一主题矩阵和第二主题矩阵,其中第一主题矩阵的行数与第二主题矩阵的行数相同;
将所述第一主题矩阵进行转置处理得到所述第一主题矩阵的转置矩阵;并
将所述转置矩阵与所述第二主题矩阵的乘积,确定为用户行为主题与内容主题之间的关系矩阵,其中,所述用户主题矩阵的列数与所述第一主题矩阵的列数相同。
采用上述流程,通过利用LDA模型对用户行为数据和内容数据进行处理得到用户行为主题与内容主题之间的关系矩阵,无需人工标注,无需设计复杂的累积逻辑。
可选地,根据所述用户行为数据和访问对象的内容数据,确定用户行为主题与内容主题之间的关系矩阵,具体包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810719454.2/2.html,转载请声明来源钻瓜专利网。
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法