[发明专利]利用网格互信息快速计算提高化工大数据建模速度的方法在审
申请号: | 201911006212.X | 申请日: | 2019-10-22 |
公开(公告)号: | CN110795839A | 公开(公告)日: | 2020-02-14 |
发明(设计)人: | 宋凯;秦立达;薛峰 | 申请(专利权)人: | 天津大学 |
主分类号: | G06F30/20 | 分类号: | G06F30/20;G06F30/18;G06F17/18 |
代理公司: | 12201 天津市北洋有限责任专利代理事务所 | 代理人: | 琪琛 |
地址: | 300350 天津市津南区海*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 大数据 网格 预处理 不规则分布 互信息计算 电脑内存 化工过程 建模过程 快速计算 互信息 有效地 建模 优化 | ||
1.一种利用网格互信息快速计算提高化工大数据建模速度的方法,其特征在于,内容包括以下步骤:
在得到数据后,确定一个合适给定的网格宽度参数,利用以下公式确定间隔:
Nm=N0(1-β)m,
其中N0是总体样本数,Nm是第m次迭代时的样本数,β是给定参数;它也可以用作停止迭代的阈值,当Nm小于N0β时迭代将停止;在每次迭代中,Nm样本中的最大欧几里德距离被用作间隔的宽度;
获得网格后可作直方图,以此来获得化工大数据的概率密度;
根据概率密度计算得到互信息;
利用互信息作为参数判断相关性,将数据中相关变量与不相关变量分成不同部分优化下一步的化工数据建模。
2.根据权利要求1所述利用网格互信息快速计算提高化工大数据建模速度的方法,其特征在于,所述互信息计算为以下公式:
I(x1,x2)=H(x1)+H(x2)-H(x1,x2),
其中H(x1)和H(x2)分别为x1和x2的信息熵,其公式为:
H(x)=-∫xP(x)logP(x)dx,
H(x1,x2)指变量x1和x2的联合熵,其公式为:
由此互信息可得出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911006212.X/1.html,转载请声明来源钻瓜专利网。