[发明专利]基于用户名的数据处理方法、装置、设备及介质在审
申请号: | 202011384574.5 | 申请日: | 2020-11-30 |
公开(公告)号: | CN112507214A | 公开(公告)日: | 2021-03-16 |
发明(设计)人: | 陶日明 | 申请(专利权)人: | 百果园技术(新加坡)有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/735 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 新加坡巴西班让路*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 用户名 数据处理 方法 装置 设备 介质 | ||
1.一种基于用户名的数据处理方法,其特征在于,包括:
获取目标用户名信息;
从预设的名称向量库中,查找与所述目标用户名信息匹配的目标用户特征向量,所述名称向量库用于存储用户特征向量和所述用户特征向量对应的用户名信息;
将所述目标用户特征向量作为任务特征输入信息并进行数据处理,得到所述目标用户名信息对应的数据处理结果。
2.根据权利要求1所述的基于用户名的数据处理方法,其特征在于,所述获取用户名信息之前,还包括:
依据历史用户的消费视频数据,确定各视频属性对应的视频组;
针对每一个视频属性对应的视频组,依据所述视频组对应的用户名信息随机生成用户名序列;
通过预设的文本分类模型对所述用户名序列进行训练,得到所述用户名序列对应的用户特征向量;
将所述用户特征向量和所述用户特征向量对应的用户名信息存储至所述名称向量库。
3.根据权利要求2所述的基于用户名的数据处理方法,其特征在于,所述依据历史用户的消费视频数据,确定各视频属性信息对应的视频组,包括:
收集历史用户的消费视频数据;
从所述消费视频数据中提取出热门视频数据;
依据视频属性对所述热门视频数据进行划分,得到各视频属性对应的视频组,所述视频组包含至少一个热门视频数据。
4.根据权利要求3所述的基于用户名的数据处理方法,其特征在于,所述依据所述视频组对应的用户名信息随机生成用户名序列,包括:
基于同一视频组中各热门视频数据的用户名信息,生成用户名集合;
基于所述用户名集合中的用户名信息和预设的序列长度阈值,生成所述视频组对应的用户名序列。
5.根据权利要求4所述的基于用户名的数据处理方法,其特征在于,基于所述用户名集合中的用户名信息和预设的序列长度阈值,生成所述视频组对应的用户名序列,包括:
从所述用户名集合中随机挑选一个用户名信息,并将挑选到的用户名信息添加到新建名称序列中;
判断所述新建名称序列的序列长度是否达到预设的序列长度阈值;
若所述新建名称序列的序列长度没有达到所述序列长度阈值,则继续从所述用户名集合中随机挑选用户名信息并将挑选到的用户名信息添加到所述新建名称序列中,直到所述新建名称序列的序列长度达到所述序列长度阈值;
当所述新建名称序列的序列长度达到所述序列长度阈值,将所述新建名称序列确定为所述视频组对应的用户名序列。
6.根据权利要求5所述的基于用户名的数据处理方法,其特征在于,在将所述新建名称序列确定为所述视频组对应的用户名序列之后,还包括:
对所述视频组对应的用户名序列进行统计,得到所述视频组的用户名序列数量;
判断所述视频组的用户名序列数量是否达到预设的序列数量阈值;
若所述视频组的用户名序列数量没有达到所述序列数量阈值,则继续基于所述用户名集合中的用户名信息和预设的序列长度阈值,生成所述视频组对应的用户名序列。
7.根据权利要求4所述的基于用户名的数据处理方法,其特征在于,所述基于同一视频组中各热门视频数据的用户名信息,生成用户名集合,包括:
对同一视频组中各热门视频数据的用户名信息进行聚合,得到初始用户名集合,所述初始用户名集合包括至少一个视频用户名;
针对所述初始用户名集合中的每一个视频用户名,依据视频用户在所述同一视频组中的行为丰富度信息生成对应的用户名权重数据,所述视频用户为所述视频用户名对应的用户;
基于所述初始用户名集合和所述初始用户名中各视频用户名对应的用户名权重数据,生成所述视频组对应的用户名集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百果园技术(新加坡)有限公司,未经百果园技术(新加坡)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011384574.5/1.html,转载请声明来源钻瓜专利网。