[发明专利]一种单变量与多变量间最大信息系数近似处理方法及系统在审
申请号: | 201910543901.8 | 申请日: | 2019-06-21 |
公开(公告)号: | CN110427401A | 公开(公告)日: | 2019-11-08 |
发明(设计)人: | 张军英;王月;杨利英 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458 |
代理公司: | 西安长和专利代理有限公司 61227 | 代理人: | 李霞 |
地址: | 710071 陕西省*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明属于数据挖掘技术领域,公开了一种在大数据集中计算单变量与多变量间的最大信息系数的方法及系统,用以计算单个变量Y与m个变量(X1,X2,...,Xm)之间的最大信息系数。该方法在于找寻多维(m+1维)空间的最优网格划分:首先利用单变量和m‑1个变量的最大信息系数算法固定m个变量(X1,X2,...,Xm)的划分,之后再对Y变量进行划分,进而找到对于变量Y与m个变量(X1,X2,...,Xm)较为合适的划分,之后计算归一化后的最大互信息值并作为最大信息系数数值。本发明能够解决现有的计算最大信息系数计算方法无法应用到计算单变量与多变量之间最大信息系数上的问题,本发明所设计的一种单变量与多变量间最大信息系数近似处理方法及系统,能够计算单个变量与多个变量之间的最大信息系数数值。 | ||
搜索关键词: | 最大信息 单变量 多变量 系数近似 数据挖掘技术 最大互信息 多个变量 系数计算 系数算法 大数据 归一化 多维 网格 应用 | ||
【主权项】:
1.一种单变量与多变量间最大信息系数近似处理方法,其特征在于,所述多变量最大信息系数处理方法计算单个变量Y与m个变量(X1,X2,...,Xm)之间的最大信息系数MIC;对于多维空间的网格划分:首先利用单变量和m‑1个变量最大信息系数算法固定m个变量(X1,X2,...,Xm)的划分,之后再对Y变量进行划分,进而找到对变量Y与m个变量(X1,X2,...,Xm)较为合适的划分,之后计算归一化后的最大互信息值并作为最大信息系数数值。系统的输入是数据,输出是经过计算获得的最大信息系数的数值。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910543901.8/,转载请声明来源钻瓜专利网。