[发明专利]用于预测能够分泌至体液中的蛋白质的方法及系统无效
申请号: | 200980139659.2 | 申请日: | 2009-08-10 |
公开(公告)号: | CN102177434A | 公开(公告)日: | 2011-09-07 |
发明(设计)人: | 崔娟;大卫·普特;徐鹰 | 申请(专利权)人: | 乔治亚大学研究基金公司 |
主分类号: | G01N33/00 | 分类号: | G01N33/00 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 丁香兰;庞东成 |
地址: | 美国乔*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 预测 能够 分泌 体液 中的 蛋白质 方法 系统 | ||
1.一种用于预测蛋白向生物流体中的分泌的方法,所述方法包括:
接收一种或多种蛋白序列;
对所接收的一种或多种蛋白序列的特征进行鉴定;和
使用已训练的分类器和所鉴定的特征,确定所述所接收的一种或多种蛋白序列分泌至所述生物流体中的概率,其中所述已训练的分类器对包含已收集的蛋白的性质的蛋白特征集进行访问,并且其中所述性质与存在于已知分泌至所述生物流体中的蛋白集中的蛋白特征对应。
2.如权利要求1所述的方法,所述方法在所述确定之前还包括:
构建包含已收集蛋白的分泌性质的特征集,其中所述分泌性质与存在于分泌蛋白的阳性蛋白集中的蛋白特征对应;和
根据所述特征集对分类器进行训练以识别蛋白特征,所述蛋白特征与可能分泌至所述生物流体中的蛋白对应。
3.如权利要求2所述的方法,所述方法还包括:
构建第二特征集,所述第二特征集包含已知因一种或多种病理状态而分泌至所述生物流体中的蛋白的性质;
根据所述第二特征集对所述分类器进行训练以识别病理相关蛋白;
使用所训练的分类器,确定在所述所接收的一种或多种蛋白序列中是否存在病理相关蛋白。
4.如权利要求3所述的方法,其中所述一种或多种病理状态包括胃癌、胰腺癌、肺癌、卵巢癌、肝癌、结肠癌、结肠直肠癌、乳腺癌、鼻咽癌、肾脏癌、子宫颈癌、脑癌、膀胱癌、肾癌、前列腺癌、黑色素瘤和鳞状细胞癌。
5.如权利要求1所述的方法,其中所述已收集的蛋白收集自蛋白数据库。
6.如权利要求5所述的方法,其中所述蛋白数据库包括Swiss-Prot数据库和分泌蛋白数据库(SPD)数据库。
7.如权利要求1所述的方法,其中所述所接收的一种或多种蛋白序列为FASTA格式。
8.如权利要求1所述的方法,其中所述蛋白为人类蛋白。
9.如权利要求2所述的方法,所述方法在所述构建前还包括:
根据所述生物流体的已知的分泌蛋白生成分泌蛋白阳性集;和
根据所述生物流体的已知的非分泌蛋白生成非分泌蛋白阴性集。
10.如权利要求9所述的方法,其中所述生物流体是血液,并且生成所述分泌蛋白阳性集包括对一种或多种非原生血液蛋白进行选择。
11.如权利要求10所述的方法,其中生成所述非分泌蛋白阴性集包括从与所述分泌蛋白阳性集不重叠的大型蛋白数据集中选出非血分泌蛋白。
12.如权利要求11所述的方法,其中所述大型蛋白数据集是蛋白家族(Pfam)数据库。
13.如权利要求2所述的方法,其中所述分泌性质包括:
一般序列特征;
物理化学性质;
结构性质;和
结构域及基序。
14.如权利要求13所述的方法,其中所述一般序列特征包括:
氨基酸组成;
序列长度;
二肽组成;
序列顺序;
标准化的Moreau-Broto自相关;和
Geary自相关。
15.如权利要求13所述的方法,其中所述物理化学性质包括:
疏水性;
标准化的范德华体积;
极性;
可极化性;
电荷;
二级结构;
溶剂可接触性;
可溶性;
可解折叠性;
无序区;
总电荷;和
憎水性。
16.如权利要求13所述的方法,其中所述结构性质包括:
二级结构内容;和
形状。
17.如权利要求13所述的方法,其中所述结构域及基序包括:
信号肽;
跨膜结构域;
糖基化;和
双精氨酸信号肽基序(TAT)。
18.如权利要求1所述的方法,其中所述生物流体是唾液、血液、尿、脊髓液、精液、阴道液、羊水、龈沟液和眼内液中的一种或多种。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于乔治亚大学研究基金公司,未经乔治亚大学研究基金公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200980139659.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:收集器组件、辐射源、光刻设备和器件制造方法
- 下一篇:空调及其控制方法