[发明专利]一种数据处理方法、装置以及计算机可读存储介质在审
申请号: | 201911101655.7 | 申请日: | 2019-11-12 |
公开(公告)号: | CN110910209A | 公开(公告)日: | 2020-03-24 |
发明(设计)人: | 陈亮 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06Q30/06 | 分类号: | G06Q30/06 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郝传鑫;熊永强 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据处理 方法 装置 以及 计算机 可读 存储 介质 | ||
1.一种数据处理方法,其特征在于,包括:
获取业务对象集合,所述业务对象集合中包括多个业务对象;
获取目标用户针对所述多个业务对象的浏览状态,根据所述浏览状态和所述业务对象集合,确定所述目标用户对应的目标正样本集合和目标负样本集合;
获取所述目标用户对应的用户行为集合,所述用户行为集合中包括所述目标用户针对所述多个业务对象的评价操作行为;
根据所述评价操作行为的评价类型,在所述用户行为集合中获取所述目标用户对应的辅助正样本集合和辅助负样本集合;
基于所述目标正样本集合、所述目标负样本集合、所述辅助正样本集合、所述辅助负样本集合和词向量模型,生成所述业务对象集合中的每个业务对象分别对应的对象属性向量。
2.根据权利要求1所述的方法,其特征在于,所述浏览状态包括已浏览状态和未浏览状态;所述根据所述浏览状态和所述业务对象集合,确定所述目标用户对应的目标正样本集合和目标负样本集合,包括:
根据所述浏览状态为所述已浏览状态的业务对象对应的对象标识,生成所述目标正样本集合;
根据所述浏览状态为所述未浏览状态的业务对象对应的对象标识,生成所述目标负样本集合。
3.根据权利要求2所述的方法,其特征在于,所述根据所述浏览状态为所述已浏览状态的业务对象对应的对象标识,生成所述目标正样本集合,包括:
获取所述浏览状态为所述已浏览状态的每个业务对象分别对应的浏览时间戳,将所述浏览时间戳在目标时间段内的业务对象确定为正样本业务对象,一个正样本业务对象对应于至少一个浏览时间戳;
根据每个正样本业务对象分别对应的至少一个浏览时间戳以及对象标识,生成正样本序列,将所述正样本序列添加至所述目标正样本集合,所述正样本序列中包括所述每个正样本业务对象分别对应的对象标识。
4.根据权利要求2所述的方法,其特征在于,所述根据所述浏览状态为所述未浏览状态的业务对象对应的对象标识,生成所述目标负样本集合,包括:
将所述正样本序列中的业务对象的对象数量确定为目标数量,获取针对所述目标数量的负样本抽取倍数;
根据所述目标数量和所述负样本抽取倍数,在所述浏览状态为所述未浏览状态的业务对象中,抽取业务对象作为负样本业务对象,所述负样本业务对象的对象数量等于所述目标数量和所述样本抽取倍数的乘积;
将所述负样本业务对象对应的对象标识,添加至所述目标负样本集合。
5.根据权利要求1所述的方法,其特征在于,所述评价类型包括正面评价类型和负面评价类型;所述用户行为集合包括多个对象操作样本,一个对象操作样本包括一个业务对象的对象标识以及所述目标用户针对该业务对象的一个评价操作行为的行为标识;
所述根据所述评价操作行为的评价类型,在所述用户行为集合中获取所述目标用户对应的辅助正样本集合和辅助负样本集合,包括:
将所述用户行为集合中,包含具有所述正面评价类型的评价操作行为的对象操作样本,确定为第一对象操作样本,将所述第一对象操作样本添加至所述辅助正样本集合;
将所述用户行为集合中,包含具有所述负面评价类型的评价操作行为的对象操作样本,确定为第二对象操作样本,将所述第二对象操作样本添加至所述辅助负样本集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911101655.7/1.html,转载请声明来源钻瓜专利网。