[发明专利]一种基于特征空间的双核多向偏最小二乘的发酵过程质量预测方法有效
申请号: | 201410075308.2 | 申请日: | 2014-03-03 |
公开(公告)号: | CN103810396B | 公开(公告)日: | 2016-10-19 |
发明(设计)人: | 王普;王锡昌;高学金;齐咏生 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06F19/00 | 分类号: | G06F19/00 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 刘萍 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 特征 空间 多向 最小 发酵 过程 质量 预测 方法 | ||
技术领域
本发明属于生物发酵领域,又属于信息科学领域,具体涉及在发酵过程中应用基于特征空间的双核多向偏最小二乘建立发酵过程的预测模型用于预测在线测量中难以及时取得的质量变量。
背景技术
发酵过程是采用现代生物工程技术,利用有益的微生物进行的生产活动,应用的微生物或微生物产物能够产生大量的经济效益。发酵过程为生物技术的重要组成部分,在制药、医疗、食品、化工、环境等领域中有着举足轻重的社会和经济价值。国家发改委、工信部发布的《食品工业十二五发展规划》写到,到2015年,发酵工业总产值将会达到4600亿元以上,年均增长率达15%以上。生物技术、药物在《医药工业“十二五”发展规划》中也被确定为发展的重点领域。
发酵过程中很大一部分过程属于间歇过程,而现代工业间歇过程倾向于向小型化,快捷化,高附加值化发展,在这过程中可以测量的数据也越来越多。但是某些数据,例如菌体浓度,产物浓度等,具有两个特点,一个是这些数据与产品质量具有很强的相关性,甚至直接影响着产品的合格率;第二个是这些数据并不容易在线测量,往往传统的测量方法在测量这些数据的时候相对其它易获得的数据具有一定的滞后,并不能及时的反应生产状况,这会影响操作人员对整个生产过程的监视和操作,甚至有可能因为不能够及时做出判断而延误关键控制机会。针对这个问题,国内外的研究重点分为两大类,一类是定性的分析,比如专家系统,这种方式虽然能够结合以往的生产经验,但是预测结果往往比较模糊;另一类是定量的分析,比如机理模型建模,这种方式虽然能够较精确的解释生产过程并对数据进行预测,但是由于生产过程机理复杂,前期机理分析困难,且实际应用时依然需要调整大量参数。基于数据驱动的分析方法属于定量分析技术的一种,其中偏最小二乘对于训练数据量要求较少,运算复杂度较低,解释效果较好而得到了广泛的应用。但是它处理的是线性问题,对于生产过程这种非线性程度较高的对象处理存在不可忽视的缺点。
为了解决过程的非线性问题,核技巧被应用到偏最小二乘算法中。核技巧能够处理生产数据的非线性问题,通过将采集到的数据投影到高维空间中降低数据本身的非线性度,进而可以在核空间中可以应用偏最小二乘算法对数据进行分析,这种方法能够较显著的提高整体的预测精度,但是依然存在问题。在偏最小二乘建模时数据是分为两组的,一组为测量数据,可以实时测量得到,另一组为质量数据,这些数据并不能够或者很难实时采集。所以,生产过程中虽然能够得到相同时刻的测量数据和质量数据,但是质量数据结果的取得往往存在一定滞后。偏最小二乘算法就是计算这两组数据间的关系,找到以测量数据计算质量数据的方法,起到实时预测质量数据的作用。核技巧将测量数据投影到高维空间中,投影之后的数据依然能够进行计算,但是将质量数据投影到高维空间中,降低质量数据的非线性度的问题并没有得到研究,并且,如何对投影到高维空间中的质量数据进行计算得到真实的质量数据也是问题。
发明内容
本发明针对间歇过程的非线性问题,提出一种基于特征空间的双核处理多向偏最小二乘算法,用核空间向量预测投影到核空间的质量数据。解决了传统核技巧难以考虑质量数据Y的非线性的问题,提高了模型的预测精度。
本发明采用了如下的技术方案和实现步骤:
1、一种基于特征空间的双核多向偏最小二乘的发酵过程质量预测方法,其特征在于包含以下步骤:
步骤(1):获取训练数据:
采集发酵过程中可在线测量的测量变量和难以在线测量的质量变量形成训练数据,具体的一次数据采样表示形式如下:
X=(x1,x2,...,xnx) (1)
Y=(y1,y2,...,yny) (2)
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410075308.2/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用