[发明专利]提取用户画像的方法、装置、计算机设备和存储介质在审
申请号: | 201910964648.3 | 申请日: | 2019-10-11 |
公开(公告)号: | CN111079056A | 公开(公告)日: | 2020-04-28 |
发明(设计)人: | 牛姣姣 | 申请(专利权)人: | 深圳壹账通智能科技有限公司 |
主分类号: | G06F16/958 | 分类号: | G06F16/958 |
代理公司: | 深圳市明日今典知识产权代理事务所(普通合伙) 44343 | 代理人: | 王杰辉 |
地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 提取 用户 画像 方法 装置 计算机 设备 存储 介质 | ||
本申请揭示了一种提取用户画像的方法、装置、计算机设备和存储介质,其中方法包括:提取出目标用户的目标数据,以及与目标用户交互的其他用户的用户账号;获取所述其他用户的其他数据;将所述目标数据转换成目标向量,将所述其他数据转换成其他向量;根据画像需求,筛选出关联用户;将目标向量与关联用户的其他向量进行聚合函数运算,将聚合结果加入到卷积层,再进行激活函数运算,得到目标用户的更新向量;基于更新向量,得到目标用户的用户画像。本申请在提取目标用户的信息时,还将与目标用户交互较多的其他用户的信息提取出来,使其他用户的特征也作为其中一个参考信息来对目标用户进行画像,这样使得目标用户的画像更加准确客观。
技术领域
本申请涉及到计算机技术领域,特别是涉及到一种提取用户画像的方法、装置、计算机设备和存储介质。
背景技术
目前对用户的画像进行提取时,往往会根据用户在服务器中阅读的文章记录、购买的历史记录、发表的评论等交互记录来提取分析出用户的喜好,从而对用户进行画像。这样提取出来的画像,由于只考虑用户自身的因素,所以提取出的用户画像不是很准确。
发明内容
本申请的主要目的为提供一种更加深度对用户进行画像的提取用户画像的方法、装置、计算机设备和存储介质。
为了实现上述发明目的,本申请提出一种提取用户的画像方法,包括:
提取出目标用户的目标数据,所述目标数据包括目标用户在服务器中的使用日志以及,与目标用户交互的其他用户的用户账号;
根据所述其他用户的用户账号,获取所述其他用户的其他数据,所述其他数据包括其他用户在服务器中的使用日志;
将所述目标数据转换成目标向量,将所述其他数据转换成其他向量;
读取后台发送的画像需求,在其他用户中筛选出与目标用户匹配的关联用户;
将目标向量与关联用户对应的其他向量进行聚合函数运算,然后将聚合结果加入到卷积层,再进行激活函数运算,得到目标用户的更新向量;
基于所述更新向量,得到所述目标用户的用户画像。
进一步地,所述目标数据包括目标用户发表评论的文本信息,所述将所述目标数据转换成目标向量的步骤,包括:
获取所述目标数据中的目标用户发表评论的文本信息;
将所述文本信息输入到预设的向量模型中,得到所述文本信息对应的情感特征值;
根据所述向量模型的情感类型数量,生成一个向量,所述向量的维度数与所述情感类型数量相同,然后将所述情感特征值作为向量的值填入到向量中,形成所述目标向量。
进一步地,所述读取后台发送的画像需求,在其他用户中筛选出与所述目标用户匹配的关联用户的步骤,包括:
分别获取目标用户与其他用户的交流互动信息;
根据每一个所述交流互动信息,分别计算得到目标用户与每一个其他用户的亲密值;
根据后台发送的画像需求,在亲密值超过预设的亲密阈值对应的其他用户中筛选出与目标用户匹配的关联用户。
进一步地,所述的基于所述更新向量,得到所述目标用户的用户画像的步骤,包括:
获取所述更新向量的每一个更新数值;
判断每一个更新数值是否超出所述更新数值对应的维度阈值范围;
若所述更新数值超过对应的维度阈值范围的上限阈值或低于所述维度阈值的下限阈值,将所述上限阈值对应的上限特征或所述下限阈值对应的下限特征作为所述目标用户的用户画像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳壹账通智能科技有限公司,未经深圳壹账通智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910964648.3/2.html,转载请声明来源钻瓜专利网。