[发明专利]一种基于可变分组的偏态分布最优参数估计方法有效
申请号: | 202010525101.6 | 申请日: | 2020-06-10 |
公开(公告)号: | CN111639443B | 公开(公告)日: | 2023-06-30 |
发明(设计)人: | 张翼飞;山石 | 申请(专利权)人: | 上海海事大学 |
主分类号: | G06F30/20 | 分类号: | G06F30/20 |
代理公司: | 上海元好知识产权代理有限公司 31323 | 代理人: | 张妍;周乃鑫 |
地址: | 201306 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 可变 分组 分布 最优 参数估计 方法 | ||
1.一种基于可变分组的词频分布模型的最优参数估计方法,其特征在于,包括以下步骤:
S1、分别对词频分布模型定义域范围内的每个待估计参数采用可变分组法将呈偏态分布的词频理论分布分成若干组;
S2、计算每个待估计参数针对词频理论分布可变分组后的统计量Z,并选择数值最小的统计量所对应的待估计参数作为词频分布模型的最优参数估计值;
所述的词频分布模型为离散型词频分布模型或连续型词频分布模型;
所述的词频理论分布为离散型词频理论分布或连续型词频理论分布;
所述的可变分组法包括以下步骤:
S1.1、根据实际样本情况选择词频理论分布初始分组数n,则每个初始分组的概率为
S1.2、将较粗略的待估计参数代入词频理论分布函数中,并以∑ipi匹配词频理论分布函数,使得词频理论分布函数保留小数点后数字为与pi相一致的精度;
S1.3、对∑ipi和匹配后的离散型词频理论分布函数F(k)在样本观察点k逐一进行比较;若∑ipi等于F(k),则保留初始分组中的第i组并将其记为可变分组的第j组;若∑ipi小于F(k),则舍去初始分组中的第i组;若∑ipi等于若干个不同样本观察点k时的理论值F(k),则对该若干个样本观察点k进行合并,共同记为可变分组的第j组;
对∑ipi和匹配后的连续型词频理论分布函数F(x)在样本观察区间(xa,xb]逐一进行比较;若∑ipi等于F(xax≤xb),则保留初始分组中的第i组并将其记为可变分组的第j组;若∑ipi小于F(xax≤xb),则舍去初始分组中的第i组;若∑ipi等于若干个不同样本观察区间(xa,b]的理论值F(xax≤xb),则对该若干个样本观察区间(xa,xb]进行合并,共同记为可变分组的第j组;
其中,j=1,...,m,m为可变分组数;
S1.4、对可变分组中组数j重新按照自然数进行序号标记;
所述步骤S2中,统计量Z的计算公式为:
式中,j为可变分组的组数序号,m为总可变分组数,N为样本容量,Npj为第j组观察值的期望值,Nj为样本中属于第j组的观察值的个数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海海事大学,未经上海海事大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010525101.6/1.html,转载请声明来源钻瓜专利网。