[发明专利]基于鲁棒回归建模预测烤片烟气苯并芘的方法有效
申请号: | 201410386226.X | 申请日: | 2014-08-07 |
公开(公告)号: | CN104102851B | 公开(公告)日: | 2017-03-08 |
发明(设计)人: | 白晓莉;彭国岗;段如敏;吴丽君;周桂圆;王保兴;卢伟;刘挺 | 申请(专利权)人: | 云南中烟工业有限责任公司 |
主分类号: | G06F19/00 | 分类号: | G06F19/00 |
代理公司: | 昆明正原专利商标代理有限公司53100 | 代理人: | 金耀生 |
地址: | 650231 *** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种基于鲁棒回归建模预测烤片烟气苯并芘的方法,通过已有的烤片理化数据和烟气B[a]P数据建立从理化指标项到烟气B[a]P的模型,对于未知烤片烟气B[a]P样本,可以利用其理化成分数据直接预测烤片烟气B[a]P值。本发明省去了由传统化学方式进行卷制、燃烧、捕捉烟气、检测等步骤;同时,采用鲁棒回归模型,可以有效地避免因理化数据或烟气数据中奇异值样本导致的弊端,很大程度上保证模型的健壮性,这点正是鲁棒回归建模优于普通线性回归建模的优点。实践证明,该模型能够有效地预测烤片的烟气B[a]P值,极大地提高检测效率,降低检测成本。 | ||
搜索关键词: | 基于 回归 建模 预测 烟气 苯并芘 方法 | ||
【主权项】:
一种基于鲁棒回归建模预测烤片烟气苯并芘的方法,其特征在于经过下列各步骤:(1)将已知烤片的理化数据与烟气B[a]P数据对应列出,建立数据样本集;所述步骤(1)的理化数据包括总糖、还原糖、烟碱、总挥发碱、总氮、烟碱氮、蛋白质、施木克值、氮碱比、氯、钾、糖碱比和氨态碱;(2)分别计算步骤(1)所得数据样本集中各理化数据的列向量x1~xn和烟气B[a]P数据的列向量y,通过下列公式分别计算各理化数据与烟气B[a]P的线性相关系数r,线性相关系数r的绝对值大于0.3所对应的该项理化数据即为对烟气B[a]P有重要影响的特征指标项,作为建模用的输入变量:r=Cov(x,y)Var(x)Var(y)---(1)]]>式中:x为某一理化数据的列向量,y为烟气B[a]P数据的列向量;(3)根据不同产地、品种、档次,均匀挑选245个烤片作为训练样本,运用鲁棒回归线性建模算法,建立烟气B[a]P预测模型,其表达式为下式:Y=AX+b=a1x1+a2x2+…+anxn+b (2)式中:Y为烟气B[a]P的模型预测值,X为理化数据向量,b为常数项,A为回归系数向量;所述运用鲁棒回归线性建模算法的步骤如下:(a)进行局部权重回归拟合:每一次拟合过程只考虑所有拟合点数的一部分,每一个被拟合点的取值都由与之邻近的局部拟合范围的散步点所决定,在每一个拟合点处都给予不同的权重系数Wi,其权重系数在拟合点处为1,局部拟合范围内拟合点的两边各点的权重系数依次以一定的规则递减至零,超出拟合范围的数据点处的权重均为0,其代数表达式为:S=Σi=1nWi(yi-y^i)2]]>式中:Wi为每个拟合点的权重系数,yi为实测值,为计算值;(b)按下式计算调整残差:radj=ri1-hi]]> h=X(XTX)‑1XT式中:ri为普通最小二乘法的残差,hi为残差调整杠杆值,用于降低影响拟合值较大点处的权重,T为转置;标准调整残差由下式给出:u=radjKs]]>s=MAD(ri)0.6745]]>式中:K为调整参数,取4.685;s为鲁棒性偏差;MAD是残差的中值绝对偏差;(c)按下式计算在局部拟合范围内每一点的鲁棒性权重:w=(1-ui2)2|ui|<10|ui|>1]]>(d)对于式(2),将常数项b纳入到回归系数向量中,则式(2)简化为:Y=a1x1+a2x2+…+anxn+b=(a1,a2,…,an,b)×(x1,x2,…,xn,1)T=AX依据权重最小二乘法求解使得下式取最小值的回归系数向量A,并计算在x0处的值:J=12[(Y-AX)TW(Y-AX)]→Min]]>式中:J为权重最小二乘法求解的目标函数;(4)依据步骤(2)选择的特征指标项,将待测烤片的对应理化数据作为输入变量套用至步骤(3)的预测模型中,即能测算得到待测烤片的烟气B[a]P的模型预测值Y。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云南中烟工业有限责任公司,未经云南中烟工业有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410386226.X/,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06 计算;推算;计数
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用