[发明专利]用于预测能够分泌至体液中的蛋白质的方法及系统无效
申请号: | 200980139659.2 | 申请日: | 2009-08-10 |
公开(公告)号: | CN102177434A | 公开(公告)日: | 2011-09-07 |
发明(设计)人: | 崔娟;大卫·普特;徐鹰 | 申请(专利权)人: | 乔治亚大学研究基金公司 |
主分类号: | G01N33/00 | 分类号: | G01N33/00 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 丁香兰;庞东成 |
地址: | 美国乔*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 预测 能够 分泌 体液 中的 蛋白质 方法 系统 | ||
关于联邦政府所资助的研发的声明
在本发明的开发过程中所进行的部分工作使用了由国家科学基金会(National Science Foundation)依据NSF/ITR-IIS-0407204授予的美国政府基金。因此,在本发明中美国政府享有确定的权利。
技术领域
本发明一般涉及对人类蛋白的计算分析,更特别地涉及预测蛋白向体液(例如血液)中的分泌。
背景技术
基因和蛋白表达的改变提供了关于组织或器官生理状态的重要线索。在恶性转化中,肿瘤细胞中的遗传改变能够破坏自分泌和旁分泌信号传导系统,从而导致可以分泌至癌细胞外部的一些类型的蛋白(例如生长因子、细胞因子和激素)的过表达(Hanahan和Weinberg,2000;Sporn和Robers,1985)。通过复杂的分泌途径,这些蛋白及其他分泌蛋白可以进入唾液、血液、尿、脑脊髓(脊髓)液、精液、阴道液、眼内液或其他体液。
对各种癌症样本的基因组学研究已鉴定出许多持续过表达的基因,而且其中一些基因编码分泌蛋白(Buckhaults等,2001;Welsh等,2003;Welsh等,2001)。举例而言,在卵巢癌中前列腺蛋白基因和骨桥蛋白基因具有升高的表达水平,而在结肠直肠癌、乳腺癌和前列腺癌中MIC1基因发生过表达。与健康个体相比,在具有这些癌症的患者的血清中已检测到这些分泌蛋白的丰度升高(Kim等,2002;Mok等,2001;Welsh等,2003)。另外已发现一些所述分泌蛋白已显示出与癌症不同发展阶段相关的血清中不同水平的浓度升高,这表示其或许可以用作癌症分型和分期的标记物(Huang等,2006)。
就准确预测哪些蛋白可能分泌至体液中而言,还存在困难和挑战。一种困难在于,必须对大量的蛋白序列和生物流体样品进行分析和分类。
对数据进行分类是一项为决定或预测数据项的类别而执行的普通任务。传统的线性分类器对所收集数据项的群体进行检查,其中每个数据项属于两种类别中的一种,并且利用所收集的数据项的性质来“训练”所述分类器,从而决定新的数据项会在哪个类别中。一种传统的分类器是支持向量机(SVM)。对于SVM,将数据项视作p维向量(p个数值的列表),并且使用SVM来确定是否能够用p-1维超平面对这些数据项进行分离。对SVM的使用是目前可利用的数据分类技术和回归分析技术。虽然一些研究已着眼于可以分泌至细胞外部的蛋白,但是目前还不存在用来预测能够分泌至特定体液(例如血液或尿)中的蛋白的可利用的方法。将针对胞外分泌蛋白而设计的预测程序用作可预测能够进入体液的蛋白的近似工具来使用,并不能给出可靠的预测。因此,所需的是如下方法和系统:允许利用一些蛋白特征对分类器进行训练,从而将能够进入体液的蛋白与不能进入体液的蛋白区分开。此外,为了优化所述分类器的性能以便能够准确预测进入体液的蛋白分泌,需要用来进行特征选择的方法和系统。
为了诊断癌症和其他疾病,对于哪些来自在患病组织(例如癌)中高度表达和异常表达的基因的蛋白能够分泌至体液中,必须做出准确的预测。与解决此问题相关的困难在于,目前对在蛋白分泌至细胞外部之后的下游定位的理解非常有限,并且现有的知识不足以提供关于蛋白分泌至体液的有用线索。因此,所需的是用来预测哪些人类蛋白可能会分泌至体液中的数据分类方法。
人类血清蛋白质组是非常复杂的混合物,其具有高度丰富的蛋白,例如清蛋白、免疫球蛋白、转铁蛋白、触珠蛋白和脂蛋白,以及由不同组织(患病组织或正常组织)所分泌的或者由人体全身的细胞所泄露的蛋白和肽(Adkins等,2002;Schrader和Schulz-Knappe,2001)。在研究人类血清蛋白质组时具挑战性的问题在于,循环中的原生血液蛋白中大多数的丰度比所关心的推定蛋白的丰度高出数个量级。所以,在事先不知道在血液中应寻找何种蛋白或蛋白特征的情况下,在数千或可能更多的原生血液蛋白中以实验手段检测此类分泌蛋白及其在血液中升高的相对丰度是非常困难的。因此,所需的是采用新型计算手段的方法和系统,以便预测在癌症组织中异常高度表达且能够分泌至体液中的蛋白,从而为对体液(例如人类血清)的定向蛋白质组学工作提供目标列表,并能够更加实际地解决对体液中标记物蛋白的鉴定。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于乔治亚大学研究基金公司,未经乔治亚大学研究基金公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200980139659.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:收集器组件、辐射源、光刻设备和器件制造方法
- 下一篇:空调及其控制方法