[发明专利]有效时间的高期望权重项集挖掘方法、装置及处理设备有效
申请号: | 201610847309.3 | 申请日: | 2016-09-23 |
公开(公告)号: | CN107870913B | 公开(公告)日: | 2021-12-14 |
发明(设计)人: | 林浚玮;甘文生;肖磊;陈伟 | 申请(专利权)人: | 腾讯科技(深圳)有限公司;哈尔滨工业大学深圳研究生院 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 王仲凯 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 有效 时间 期望 权重 挖掘 方法 装置 处理 设备 | ||
1.一种面向商品交易记录的有效时间的高期望权重项集挖掘方法,其特征在于,包括:
确定待处理项集所对应的至少一个目标事务;所述待处理项集为待处理的商品的数据项的集合;所述待处理项集所对应的目标事务为,交易类型的不确定数据库中包含所述待处理项集所有数据项的事务;所述交易类型的不确定数据库是指事务中的数据项存在一定发生概率的数据库;每条事务对应一条商品的交易记录,每条事务包括至少一个商品的数据项;
根据预定义的时间衰减因子,确定所述待处理项集在各目标事务中的时间有效值;将所述待处理项集在各目标事务中的时间有效值相加,确定所述待处理项集在所述交易类型的不确定数据库中的时间有效值;
确定所述待处理项集在各目标事务中的项集概率;将所述待处理项集在各目标事务中的项集概率相加,确定所述待处理项集的期望支持度;
将所述待处理项集的期望支持度,和所述待处理项集的项集权重值相乘,确定所述待处理项集的期望权重支持度;其中,所述待处理项集的项集权重值根据预定义的所述待处理项集中各个数据项的权重值确定;
如果所述待处理项集在所述交易类型的不确定数据库中的时间有效值不小于预定义的最低时间有效阈值,且所述待处理项集的期望权重支持度不小于预定义的最低期望权重阈值和所述交易类型的不确定数据库中事务总数的乘积,则确定所述待处理项集为有效时间的高期望权重项集,以便在对用户作内容推荐时,将所述待处理的商品的数据项的集合推荐给所述用户。
2.根据权利要求1所述的面向商品交易记录的有效时间的高期望权重项集挖掘方法,其特征在于,所述待处理项集在一个目标事务中的时间有效值,等于该目标事务的时间有效值;所述根据预定义的时间衰减因子,确定所述待处理项集在各目标事务中的时间有效值包括:
根据预定义的时间衰减因子,当前时间,各个目标事务的发生时间,分别确定各个目标事务的时间有效值;
将所确定的各个目标事务的时间有效值,确定为待处理项集在各目标事务中的时间有效值。
3.根据权利要求2所述的面向商品交易记录的有效时间的高期望权重项集挖掘方法,其特征在于,所述根据预定义的时间衰减因子,当前时间,各个目标事务的发生时间,分别确定各个目标事务的时间有效值包括:
根据公式确定目标事务Tq的时间有效值,其中δ∈(0,1)为预定义的时间衰减因子,R(Tq)为目标事务Tq的时间有效值,tcurrent表示当前时间,tq表示目标事务Tq的发生时间。
4.根据权利要求1所述的面向商品交易记录的有效时间的高期望权重项集挖掘方法,其特征在于,一个事务记录有至少一个数据项,及各数据项的发生概率;所述确定所述待处理项集在各目标事务中的项集概率包括:
对于每一个目标事务,将待处理项集的各个数据项在目标事务中的发生概率的乘积,作为所述待处理项集在该目标事务中的项集概率,以确定所述待处理项集在各目标事务中的项集概率。
5.根据权利要求1所述的面向商品交易记录的有效时间的高期望权重项集挖掘方法,其特征在于,所述待处理项集的项集权重值的确定过程包括:
从预定义的权重表中确定待处理项集的各个数据项的权重值,所述权重表记录有所述交易类型的不确定数据库中各数据项对应的权重值;
确定所述待处理项集的各个数据项的权重总值;
将所述待处理项集的各个数据项的权重总值,除以所述待处理项集的数据项个数,得到所述待处理项集的项集权重值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司;哈尔滨工业大学深圳研究生院,未经腾讯科技(深圳)有限公司;哈尔滨工业大学深圳研究生院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610847309.3/1.html,转载请声明来源钻瓜专利网。