[发明专利]一种基于大数据的并行方差分析方法及装置有效

专利信息
申请号: 201710398191.5 申请日: 2017-05-31
公开(公告)号: CN107229600B 公开(公告)日: 2020-06-23
发明(设计)人: 吴斌;卜尧;闫丹凤;王柏;刘东岳;陈玉峰 申请(专利权)人: 北京邮电大学
主分类号: G06F17/16 分类号: G06F17/16
代理公司: 北京柏杉松知识产权代理事务所(普通合伙) 11413 代理人: 马敬;项京
地址: 100876 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 数据 并行 方差分析 方法 装置
【权利要求书】:

1.一种基于大数据的并行方差分析方法,其特征在于,该方法包括:

利用分布式文件系统HDFS读取试验数据,并存储所述试验数据,所述试验数据为:行为m、列为p的矩阵,矩阵的每个元素为试验数据Xijx,其中,m代表因素A中不同影响水平的个数,因素A中不同影响水平记为A1、A2、…、Ai、…、Am,r代表因素B中不同水平的个数,因素B中不同影响水平记为B1、B2、…、Bj、…、Br,s代表重复做试验的次数;Ai和Bj所做的试验数据为Xij1、Xij2、…、Xijx、…、Xijs;i∈[1,2,L,m],j∈[1,2,L,r],x∈[1,2,L,s],i、j、x、s、m和r属于自然数,且s、m和r中至少两项不能同时取零;

创建一个程序初始运行环境SparkContext;

根据所有试验数据,在所述SparkContext中计算统计量F;

加载F分布表,并查询F分布表,获得Fα值,获取信度阈值α=s0和α=s1,利用F分布表,根据信度阈值α=s0和α=s1在组间的自由度和组内的自由度对应寻找Fs0和Fs1;其中,Fα为因素A的信度α对应的统计量,Fs0为因素A的信度阈值s0对应的统计量,Fs1为因素A的信度阈值s1对应的统计量;

比较Fs0、Fs1和F,若F<Fs0,则影响不显著,Fs1≤F<Fs0,则影响一般显著;若Fα≥Fs1,则影响高度显著。

2.如权利要求1所述的方法,其特征在于,所述利用分布式文件系统HDFS读取形式如下矩阵的试验数据,包括:

利用分布式文件系统HDFS读取当m≠0、r=0、s≠0时矩阵中的试验数据,所述当m≠0、r=0、s≠0时矩阵中的试验数据为:行为m、列为s的试验数据Xix

3.如权利要求1所述的方法,其特征在于,所述利用分布式文件系统HDFS读取形式如下矩阵的试验数据,包括:

利用分布式文件系统HDFS读取当m≠0、r≠0、s=1时矩阵中的试验数据,所述m≠0、r≠0、s=1时矩阵中的试验数据为:行为m、列为r的试验数据Xij

4.如权利要求1所述的方法,其特征在于,所述利用分布式文件系统HDFS读取形式如下矩阵的试验数据,包括:

利用分布式文件系统HDFS读取当m≠0、r≠0、s≠0时矩阵中的试验数据,所述m≠0、r≠0、s≠0时矩阵中的试验数据为:行为m、列为r·s的试验数据Xijx

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710398191.5/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top