[发明专利]高平均效用项集挖掘方法、装置及计算机设备有效
申请号: | 201811320172.1 | 申请日: | 2018-11-07 |
公开(公告)号: | CN109408563B | 公开(公告)日: | 2021-06-22 |
发明(设计)人: | 林浚玮;张玉龙;刘婷婷;陈伟 | 申请(专利权)人: | 哈尔滨工业大学(深圳);腾讯科技(深圳)有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 王仲凯 |
地址: | 518055 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 平均 效用 挖掘 方法 装置 计算机 设备 | ||
本申请公开了一种高平均效用项集挖掘方法、装置及计算机设备,在该方法中,如果累计插入数据库的所有事务的总效用值小于效用安全值,则确定当前数据库中尚未被挖掘处理的数据集合所包含的各个1‑项集的平均效用列表,并获取存储的原始数据库中具备项集扩展条件的至少一个1‑项集的平均效用列表;依据数据集合中各个1‑项集的平均效用列表和该原始数据库中具备项集扩展条件的至少一个1‑项集的平均效用列表,确定该数据库中的高平均效用项集。本申请的方案可以降低从数据库中挖掘数据所需耗费的计算资源。
技术领域
本申请涉及数据处理领域,尤其涉及一种高平均效用项集挖掘方法、装置及计算机设备。
背景技术
高效用项集的挖掘被广泛应用于多种领域中,如,商业搜索中的热点高频词挖掘;又如,对用于感兴趣的内容(如,网页、新闻、商品等)进行推荐等。但是由于高效用项集的挖掘并没有考虑项集长度对效用值的影响,所以高平均效用项集挖掘被提出。
高平均效用项集挖掘可以从数据库中挖掘出平均效用值较高的项集。在从数据库中挖掘高平均效用项集时,需要扫描整个数据库,即依次搜寻并处理数据库中记录的各条事务的数据项,才可以从数据库中挖掘出高平均效用项集。然而,数据库经常会存在新增数据,一旦数据库中出现新增数据,数据库中所能挖掘出的高平均效用项集就可能会发生变化。因此,只要数据库存在新增数据,就需要重新扫描更新后的整个数据库,才可以从更新后的数据库中挖掘出高平均效用项集,而由于数据库的数据量较多,扫描整个数据库必然需要耗费较多的计算资源。
发明内容
有鉴于此,本申请提供了一种高平均效用项集挖掘方法、装置及计算机设备,以在数据库中存在新增数据的情况下,降低从数据库中挖掘数据所需耗费的计算资源。
为实现上述目的,一方面,本申请提供了如下方案:
一种高平均效用项集挖掘方法,包括:
依据插入到数据库中且尚未被挖掘处理的数据集合所包含的至少一条事务,确定当前时刻之前所述数据库中累计插入的所有事务的总效用值;
获得与所述数据库的初始总效用值对应的效用安全值,所述初始总效用值为在向所述数据库插入所述所有事务之前,所述数据库的总效用值;
当所述所有事务的总效用值小于所述效用安全值时,确定所述数据集合中各个1-项集的平均效用列表,每个所述1-项集的平均效用列表中至少记录有包含该1-项集的各个目标事务,以及该1-项集在每个所述目标事务中的效用值;
获取存储的原始数据库中具备项集扩展条件的至少一个1-项集的平均效用列表;其中,所述原始数据库为插入所述数据集合之前的所述数据库,所述具备项集扩展条件的1-项集为在从所述原始数据库中挖掘高平均效用项集时确定出的,平均效用边界大于所述原始数据库对应的低平均效用阈值的1-项集;项集的平均效用边界为包含该项集的各个事务的最大效用值的总和;
依据所述数据集合中各个1-项集的平均效用列表和所述原始数据库中具备项集扩展条件的至少一个1-项集的平均效用列表,确定所述数据库中的高平均效用项集。
又一方面,本申请还提供了一种高平均效用项集挖掘装置,包括:
事务效用确定单元,用于依据插入到数据库中且尚未被挖掘处理的数据集合所包含的至少一条事务,确定当前时刻之前所述数据库中累计插入的所有事务的总效用值;
安全值获取单元,用于获得与所述数据库的初始总效用值对应的效用安全值,所述初始总效用值为在向所述数据库插入所述所有事务之前,所述数据库的总效用值;
第一列表获取单元,用于当所述所有事务的总效用值小于所述效用安全值时,确定所述数据集合中各个1-项集的平均效用列表,每个所述1-项集的平均效用列表中至少记录有包含该1-项集的各个目标事务,以及该1-项集在每个所述目标事务中的效用值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学(深圳);腾讯科技(深圳)有限公司,未经哈尔滨工业大学(深圳);腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811320172.1/2.html,转载请声明来源钻瓜专利网。