[发明专利]一种基于保序子矩阵的约束双聚类挖掘及缺失值预测方法有效
申请号: | 201910468279.9 | 申请日: | 2019-05-31 |
公开(公告)号: | CN110222089B | 公开(公告)日: | 2021-05-14 |
发明(设计)人: | 钟佳琪;李东;方琼 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/28 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 何淑珍;陈伟斌 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于保序子矩阵的约束双聚类挖掘及缺失值预测方法,包括以下步骤:S1、接收请求并挖掘数据矩阵的双聚类模式;S2、计算行和列的重叠度和覆盖率;S3、判断行列覆盖率是否收敛,若否则进行步骤S4,否则进行步骤S9;S4、随机打乱数据矩阵中行和列的排列顺序,对候选列集合排序;S5、判断候选列集合是否为空;S6、判断候选列集合中是否存在合格列;S7、根据新选出的合格列扩展双聚类模式的列集合和行集合;S8、判断当前双聚类模式是否符合稀疏保序子矩阵模型的要求;S9、计算每个双聚类模式的缺失值;S10、返回最终的双聚类集合和缺失值。因此,本发明有效地提高了双聚类模式的质量和缺失值预测的准确性。 | ||
搜索关键词: | 一种 基于 保序子 矩阵 约束 双聚类 挖掘 缺失 预测 方法 | ||
【主权项】:
1.一种基于保序子矩阵的约束双聚类挖掘及缺失值预测方法,其特征在于,所述方法包括以下步骤:S1、用户输入双聚类模式挖掘的请求内容,计算机接收请求并挖掘请求内容中待挖掘的数据矩阵的双聚类模式;S2、计算当前双聚类模式集合的行和列的重叠度和覆盖率;S3、判断行和列的覆盖率是否均已收敛,若否则进行步骤S4,若是则进行步骤S9;S4、随机打乱数据矩阵中行和列的排列顺序,用打乱排列顺序之后的数据矩阵的列集合初始化双聚类模式的候选列集合,再对候选列集合中的列按照重叠度从小到大排序,若存在两列的重叠度相同,则按照列的随机排列顺序从小到大排序;S5、判断候选列集合是否为空,若是则返回步骤S2更新挖掘后的当前双聚类模式集合的行和列的覆盖率和重叠度信息,若否则进行步骤S6;S6、从头到尾遍历候选列集合中的所有元素,并判断是否存在某列使得如果将该列加入到当前双聚类模式的列集合的末尾该双聚类模式新的列集合对应的有效行数不小于事先定义的稀疏保序子矩阵模型规定的最小行数阈值且扩展该列不会使双聚类模式集合的最大行重叠度增大,若存在,则把相应的列标记为合格列并进行步骤S7,若否则进行步骤S8;S7、更新当前双聚类模式:将步骤S6中选出的合格列加入到当前双聚类模式的列集合的末尾,并把对应的有效行加入到当前双聚类模式的行集合中;S8、判断当前双聚类模式是否符合稀疏保序子矩阵模型的规定,若是则将其保存在双聚类模式集合中,若否则将其丢弃;S9、遍历当前双聚类模式集合,根据线性拟合方法计算每个双聚类模式中的缺失值;S10、输出最终挖掘出的双聚类模式集合和缺失值的计算结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910468279.9/,转载请声明来源钻瓜专利网。