[发明专利]一种基于信息熵的不确定高效用模式挖掘方法在审

专利信息
申请号: 202011281070.0 申请日: 2020-11-16
公开(公告)号: CN112434031A 公开(公告)日: 2021-03-02
发明(设计)人: 唐辉军;吴一涛;林佳辉 申请(专利权)人: 宁波财经学院
主分类号: G06F16/22 分类号: G06F16/22;G06F16/2458;G06F17/11
代理公司: 苏州中合知识产权代理事务所(普通合伙) 32266 代理人: 赵路路
地址: 315000 浙*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 信息 不确定 效用 模式 挖掘 方法
【权利要求书】:

1.一种基于信息熵的不确定高效用模式挖掘方法,其特征在于,包括如下步骤:

S1:获取事务数据集,利用信息熵确定事务数据集内各项集的权值;

S2:根据确定的权值获取各项集的事务效用值;

S3:将各项集的事务效用值分别与最小效用值进行对比,根据对比结果构建全局头表和全局树;

S4:根据全局头表和全局树,采用模式迭代的方法挖掘得到全部的不确定高效用模式。

2.根据权利要求1所述的一种基于信息熵的不确定高效用模式挖掘方法,其特征在于,所述最小效用值的计算公式:

minUti=Threshold*swu(D)

式中,最小效用阈值Threshold是用户定义的一个大小在0~1之间的值,swu(D)是事务数据集D的总的效用值,minUti表示了用户的期望最小效用值。

3.根据权利要求1所述的一种基于信息熵的不确定高效用模式挖掘方法,其特征在于,所述信息熵H(x)的定义如下所示:

式中,项x在事务t中的内部效用值为q(x,t),p(x,t)表示了项x在事务t中的中概率,H(x)表示了该项在总数据集中的信息熵,ir表示事务ti中的各个项,n表示了事务的总个数,i表示了事务的顺序号。

4.根据权利要求1所述的一种基于信息熵的不确定高效用模式挖掘方法,其特征在于,所述全局树中每一个节点包括两个数值列表,前一个数值列表表示路径上各个节点的内部效用值;后一个数值列表表示头表中按照信息熵的值从大到小位置排列的节点下标。

5.根据权利要求1所述的一种基于信息熵的不确定高效用模式挖掘方法,其特征在于,所述根据对比结果构建全局头表和全局树,具体包括如下步骤:

S3.1:若对比项集的事务效用值小于最小效用值,则删除该项集从全局头表中删除;

S3.2:若对比项集的事务效用值不小于最小效用值,则将该项集保存,并按照该项集的信息熵在所有不小于最小效用值的项集中排行顺序添加至全局树中。

6.根据权利要求1所述的一种基于信息熵的不确定高效用模式挖掘方法,其特征在于,步骤S4,具体包括如下步骤:

S4.1:从头表中的最后一项Q1开始依次循环执行步骤S4.2~步骤S4.13;

S4.2:利用头表找到项Q1对应在全局树中的所有节点对应的数值列表,计算Q1的事务效用值swu(Q1);

S4.3:若swu(Q1)不小于minUti,则执行步骤S4.4~步骤S4.12;否则执行步骤S4.13;

S4.4:生成一个数据模式X=X∪{Q1};

S4.5:计算项集X的事务效用值,若u(X)不小于minUti,则将项集X添加到不确定高效用模式中;

S4.6:为项集X创建子树sT和子头表sH,从子头表的最后一项Q2开始依次循环执行步骤S4.7~步骤S4.12;

S4.7:利用头表找到项Q2对应在全局树中的所有节点对应的数值列表,计算Q2的事务效用值swu(Q2);

S4.8:若swu(Q2)不小于minUti,则执行步骤S4.9~步骤S4.11;否则执行步骤S4.12;

S4.9:生成一个数据模式Y=Y∪{Q2};

S4.10:计算项集Y的事务效用值,若u(Y)不小于minUti,则将项集Y添加到不确定高效用模式中;

S4.11:为Y分别创建子树yT和子头表yH,转步骤S4.7;

S4.12:将项Q2对应在yT上的叶子结点的效用信息传递给其对应的父节点,直到父节点为根节点结束当前循环,进入下一项循环,直至循环结束;

S4.13:将项Q1对应在全局树上的结点效用信息传递给其对应的父结点,直到父节点为根节点结束当前循环,进入下一项循环,循环结束。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宁波财经学院,未经宁波财经学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011281070.0/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top