[发明专利]小样本下装备平均修复时间的非统计估计模型在审
申请号: | 201910246874.8 | 申请日: | 2019-03-29 |
公开(公告)号: | CN110008568A | 公开(公告)日: | 2019-07-12 |
发明(设计)人: | 柯宏发;祝冀鲁;吴红朴;侯兴明;陈小卫;李巧丽 | 申请(专利权)人: | 中国人民解放军战略支援部队航天工程大学 |
主分类号: | G06F17/50 | 分类号: | G06F17/50 |
代理公司: | 洛阳市凯旋专利事务所 41112 | 代理人: | 陆君 |
地址: | 北京市怀柔*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及装备试验与鉴定技术领域,公开的一种小样本下装备平均修复时间的非统计估计模型,其步骤如下:1)小样本数据的离散GM(1,1)模型生成,包括离散GM(1,1)模型,基于离散GM(1,1)模型的自助抽样生成;2)基于未确知有理数的参数估计,包括未确知有理数的构造及优化,基于未确知有理数的点估计,基于未确知有理数的区间估计;3)非统计估计过程和方法框架。本发明利用非统计估计算法对装备维修时间原始数据进行处理,根据两个数据样本的点估计、区间估计都是比较接近的,能够估计置信度也很接近,即基于离散GM(1,1)模型的样本数据挖掘生成是有效可行;小样本装备平均修复时间的非统计估计模型有效可行。 | ||
搜索关键词: | 小样本 统计估计模型 区间估计 修复 参数估计 估计算法 鉴定技术 模型生成 数据样本 样本数据 原始数据 装备维修 置信度 统计 抽样 挖掘 试验 优化 | ||
【主权项】:
1.一种小样本下装备平均修复时间的非统计估计模型,其特征是:其步骤如下:1)小样本数据的离散GM(1,1)模型生成在武器装备试验活动中,由于试验条件和费用的限制,很多测试指标得到的数据样本量是很小的,数据集合描述为X={x(t);t=1,2,…,N} (1)式中x(t)为第t个测量数据,N为测量数据总数;通常情况下N≤(5~10),难以确定该指标数据的概率分布特征,即使假设其服从正态分布,参数估计的置信度也难以保证;灰色系统理论认为,这N个小样本数据所携带的信息不足以确定测试指标的真实状态和数量关系,但是已经部分地反映了测试指标的真实状态,通过“已知部分”推断“未知部分”正是灰色系统技术与方法的优势;本部分介绍离散GM(1,1)模型及其求解算法,以及基于离散GM(1,1)模型的数据生成流程;1.1离散GM(1,1)模型,假设原始数据列为X(0)=((x(0)(1),…,x(0)(n)),其中x(0)(k)≥0(k=1,…,n);定义X(0)的1‑AGO序列为X(1)=(x(1)(1),…,x(1)(n)),其中k=1,2,…,n;则称x(1)(k+1)=β1x(1)(k)+β2 (2)为GM(1,1)模型的离散形式,简称离散GM(1,1)模型;式中参数β1、β2为待估计参数;上述离散GM(1,1)模型中待估计参数表示为参数列运用最小二乘法即可得到其中Y、B分别为令初始条件为x(1)(0)=x(0)(1),从而得到离散GM(1,1)模型的时间响应序列为根据其累减还原式可以得到X(0)的时间响应序列为式中k=1,2,…,n;在装备维修时间的实际建模过程中,取初始序列为X(1),其1阶累减生成序列为X(0),建立离散GM(1,1)模型直接对X(1)进行模拟;1.2基于离散GM(1,1)模型的自助抽样生成,将自助抽样生成的样本量选为:N+A=30;自助抽样生成的基本原理是从原始数据集合X中的概率放回地随机抽取1个数据,记为x1(1),该抽取过程重复m次即可得到第1个自助样本,记为X1={x1(1),x1(2),…,x1(m)} (7)根据离散GM(1,1)模型的建模数据需求,确定m=5~8;上述获得自助样本的整体抽取过程连续重复A次,则会得到A个自助再抽样样本,再抽样样本集合记为Y={X1,X2,…,Xi,…XA} (8)式中Xi={xi(1),xi(2),…,xi(m)};针对自助样本Xi建立离散GM(1,1)模型,对其时间响应序列进行一次累减生成,即可得到自助样本Xi中第m+1个预测值,记为于是得到自助再抽样样本集合,即新的装备维修时间数据集合为X={x(1),…,x(N),x(N+1),…,x(N+A)} (10)式中x(N+1),…,x(N+A)分别为A个自助再抽样样本的离散GM(1,1)模型预测值;基于离散GM(1,1)模型的自助抽样生成过程通过对原始数据序列的随机抽样挖掘,其中自助再抽样样本集合X依然不能全面反映测试指标的真实状态,在本质、性质上还是“部分已知、部分未知”地实现对测试指标真实状态的认知;和原始N个数据所表征的“部分已知、部分未知”相比,前者的“已知部分”要远远地多于后者,这也是自助抽样挖掘的目的和作用;2)基于未确知有理数的参数估计2.1未确知有理数的构造及优化,针对上述自助再抽样样本集合X,构造一个k(k<N+A)阶未确知有理数对这N+A个数据进行整体上的描述;首先记a=min{x(1),…,x(N),x(N+1),…,x(N+A)} (11)b=max{x(1),…,x(N),x(N+1),…,x(N+A)} (12)然后区间[a,b]进行某种划分,以小区间的中间值xi(a≤xi≤b)为中心,并以λ为控制半径确定一数据领域,统计N+A个数据在该领域出现的频率,则得到表达式式中φ(x)定义为可信度分布密度函数,αi为自助抽样数据取值xi时的可信度,且有0<αi<1;表示总可信度,且有0<α≤1;简便地,将上述过程的未确知有理数记为[[a,b],φ(x)];通常对区间[a,b]进行2k个等值划分,使得自助抽样数据值xi的领域控制半径均相等,则得到xi(i=1,2,…,k)的表达式为可信度αi则用自助抽样数据在xi为中心的控制领域内出现的频率表示,即有式中βi表示在xi为中心、为半径的控制领域内的自助抽样数据个数;从上述构造过程知道,未确知有理数的阶数k决定了数据领域的控制半径,表征了对自助再抽样样本集合X刻画的精细程度,阶数k越大,刻画越精细;但是阶数k取值并非越大越好,可信度αi表明取值xi对样本集合X刻画的不确定性程度,当阶数k取值趋近于N+A时,刻画的不确定性程度就越来越大;信息论的熵常常被用来刻画不确定性,此处的可信度熵同样用来反映对样本集合X刻画的不确定性程度,基于可信度熵的最大值就能够确定未确知有理数的最佳阶数;针对上述k阶未确知有理数的可信度熵令则k*即为所求的未确知有理数最佳阶数;此时将k*阶未确知有理数A记为A=[[a,b],φ(x)],其中2.2基于未确知有理数的点估计,对上述优化的k*阶未确知有理数进行有关处理,即可得到自助再抽样样本的点估计和区间估计;针对该k*阶未确知有理数A,称下列一阶未确知有理数为其数学期望,也称E(A)为未确知期望或均值;用方差D(A)来描述未确知有理数A到E(A)的离散程度,即于是,有自助再抽样样本的点估计值为其估计精度为综合未确知期望的可信度,则定义自助再抽样样本点估计的置信度为2.3基于未确知有理数的区间估计,采用常用标准正态分布上侧β分位点:β:0.001、0.005、0.010、0.025、0.050、0.100、0.200;u(β):3.090、2.576、2.327、1.960、1.645、1.282、0.8416;假设自助再抽样样本的分布特征,用区间估计法给出样本的取值范围;假设自助再抽样样本服从正态分布,给定置信水平1‑β,通过常用标准正态分布上侧β分位点中查询u(β/2),则给定置信水平下置信区间半长度ε的计算公式为于是计算自助再抽样样本的点估计值在置信水平1‑β下的置信区间针对自助再抽样挖掘生成的N+A个数据,假设有t个数据位于上述置信区间之外,同时综合估计区间的置信水平,则定义自助再抽样样本上述区间估计的置信度为此处需要注意置信水平和置信度两个概念的联系与区别;关于对装备维修时间的非统计估计分为自助再抽样生成、参数描述、参数估计的过程,置信水平反映了正态分布假设条件下区间估计的可靠性,覆盖了参数估计过程;而点估计和区间估计的置信度则覆盖了装备维修时间的非统计估计全过程,置信水平对区间估计置信度有一份贡献率;3)非统计估计过程和方法框架基于离散GM(1,1)模型的自助抽样生成和未确知有理数的装备维修时间非统计估计,就是在小样本自助再抽样生成、参数描述与估计的过程中,应用离散GM(1,1)建模技术、未确知有理数构造方法、基于未确知有理数的点估计和区间估计的一种分析方法。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军战略支援部队航天工程大学,未经中国人民解放军战略支援部队航天工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910246874.8/,转载请声明来源钻瓜专利网。