[发明专利]有效时间的高期望权重项集挖掘方法、装置及处理设备有效

专利信息
申请号: 201610847309.3 申请日: 2016-09-23
公开(公告)号: CN107870913B 公开(公告)日: 2021-12-14
发明(设计)人: 林浚玮;甘文生;肖磊;陈伟 申请(专利权)人: 腾讯科技(深圳)有限公司;哈尔滨工业大学深圳研究生院
主分类号: G06F16/2458 分类号: G06F16/2458
代理公司: 深圳市深佳知识产权代理事务所(普通合伙) 44285 代理人: 王仲凯
地址: 518000 广东省深圳*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 有效 时间 期望 权重 挖掘 方法 装置 处理 设备
【说明书】:

发明实施例提供一种有效时间的高期望权重项集挖掘方法、装置及处理设备,该方法包括:确定待处理项集所对应的至少一个目标事务;确定所述待处理项集在不确定数据库中的时间有效值;确定所述待处理项集的期望支持度;将所述待处理项集的期望支持度,和所述待处理项集的项集权重值相乘,确定所述待处理项集的期望权重支持度;如果所述待处理项集在不确定数据库中的时间有效值不小于,预定义的最低时间有效阈值,且所述待处理项集的期望权重支持度,不小于,预定义的最低期望权重阈值和不确定数据库中事务总数的乘积,则确定所述待处理项集为有效时间的高期望权重项集。本发明实施例实现了不确定数据库中有效时间的高期望权重项集的挖掘。

技术领域

本发明涉及数据处理技术领域,具体涉及一种有效时间的高期望权重项集挖掘方法、装置及处理设备。

背景技术

目前在对用户感兴趣的内容(如网页、新闻、商品等)进行推荐,对频繁搜索的热点高频词进行挖掘时,往往需要从数据库中挖掘出有效时间的高期望权重项集;有效时间的高期望权重项集指的是,数据库中具有高时效性且期望频繁的项集,表示的是数据库中近期有效的高期望权重项集。需要说明的是,数据库通常记录有至少一条交易、新闻等事务,每条事务中包括至少一个数据项,而为表征数据库中数据项间的关联规则,至少一个数据项又会集合形成一个项集。

目前一般是基于权重因素的挖掘算法,从数据库中挖掘出有效时间的高期望权重项集,这些算法一般是简单的基于权重因素进行项集的挖掘,只能对存储有精确数据的数据库进行项集的挖掘;然而,在实际挖掘过程中,数据的型态各异,数据库中的数据往往蕴含着不确定性(即数据库中往往存储有不确定数据);当从存储有不确定数据的数据库(简称不确定数据库)挖掘有效时间的高期望权重项集时,目前的这些基于权重因素的挖掘算法并不适用;比如,某数据库中储存了过去三年的交易记录,里面的数据项为不同的商品,其中,笔记本对应的权重值为0.4,面包对应的权重值为0.001,电风扇对应的权重值则为0.05,可见,数据项间对应的权重值是不同的,如果需要挖掘出六个月里的高期望权重项集,则根据目前的基于权重因素的挖掘算法是无法对不确定数据库进行挖掘的,会导致挖掘不出有效时间的高期望权重项集的情况出现。

发明内容

有鉴于此,本发明实施例提供一种有效时间的高期望权重项集挖掘方法、装置及处理设备,以从不确定数据库中挖掘出有效时间的高期望权重项集。

为实现上述目的,本发明实施例提供如下技术方案:

一种有效时间的高期望权重项集挖掘方法,包括:

确定待处理项集所对应的至少一个目标事务;所述待处理项集所对应的目标事务为,不确定数据库中包含所述待处理项集所有数据项的事务;

根据预定义的时间衰减因子,确定所述待处理项集在各目标事务中的时间有效值;将所述待处理项集在各目标事务中的时间有效值相加,确定所述待处理项集在不确定数据库中的时间有效值;

确定所述待处理项集在各目标事务中的项集概率;将所述待处理项集在各目标事务中的项集概率相加,确定所述待处理项集的期望支持度;

将所述待处理项集的期望支持度,和所述待处理项集的项集权重值相乘,确定所述待处理项集的期望权重支持度;其中,所述待处理项集的项集权重值根据预定义的所述待处理项集中各个数据项的权重值确定;

如果所述待处理项集在不确定数据库中的时间有效值不小于,预定义的最低时间有效阈值,且所述待处理项集的期望权重支持度,不小于,预定义的最低期望权重阈值和不确定数据库中事务总数的乘积,则确定所述待处理项集为有效时间的高期望权重项集。

本发明实施例还提供一种有效时间的高期望权重项集挖掘装置,包括:

目标事务确定模块,用于确定待处理项集所对应的至少一个目标事务;所述待处理项集所对应的目标事务为,不确定数据库中包含所述待处理项集所有数据项的事务;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司;哈尔滨工业大学深圳研究生院,未经腾讯科技(深圳)有限公司;哈尔滨工业大学深圳研究生院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201610847309.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top