[发明专利]一种协同抗癌症药物组合预测方法及药物组合物有效
申请号: | 201510464329.8 | 申请日: | 2015-07-31 |
公开(公告)号: | CN105138862B | 公开(公告)日: | 2017-12-26 |
发明(设计)人: | 曹志伟;费俭;孙怡;刘琦;盛振 | 申请(专利权)人: | 同济大学 |
主分类号: | G06F19/12 | 分类号: | G06F19/12;G06F19/24 |
代理公司: | 上海科盛知识产权代理有限公司31225 | 代理人: | 应小波 |
地址: | 200092 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种协同抗癌症药物组合预测方法及药物组合物,包括以下步骤1)数据收集根据药物组合的疾病治疗效果不同,分类得到已知协同抗癌症药物组合以及相应的靶点;2)模型建立对于已知协同抗癌症药物组合以及未知药物组合,计算协同抗癌症药物组合的特征,建立协同抗癌症药物组合预测模型;3)结果过滤利用药物表达谱信息,探索归纳已知协同抗癌症药物组合的特征,对步骤2)的预测结果进行筛除。基于该方法得到抗乳腺癌药物组合物和抗肺癌药物组合物。与现有技术相比,本发明综合运用药物组合的各种特征,设计巧妙,预测准确,并具有重要的实际应用价值,适用于大规模推广应用。 | ||
搜索关键词: | 一种 协同 抗癌 药物 组合 预测 方法 | ||
【主权项】:
一种协同抗癌症药物组合预测方法,其特征在于,包括以下步骤:1)数据收集:构建待筛选的未知药物组合,以及每个药物相应的靶点数据集;2)模型建立:对于已知协同抗癌症药物组合以及未知药物组合,筛选差异特征,建立协同抗癌症药物组合预测模型;3)结果过滤:利用药物表达谱的特征,对步骤2)的预测结果进行筛除;所述的步骤1)为:设计系列特征,筛选能够显著区分协同抗癌症药物组合的描述性特征;整理待预测协同抗癌的药物,收集药物作用靶点;将待预测药物随机组合成未知药物组合数据集;所述的步骤1)具体为:(1)收集已知的抗癌药物组合,提取每个药物的靶点信息;(2)收集设计系列特征,通过统计检验,筛选能显著区分协同抗癌症药物组合的描述性特征;所述的统计检验具体为:首先由已知的协同抗癌症药物组合构成正样本,假设有N组,计算这N组的特征值,计算平均值;由正样本中的药物随机组合,并去除已知协同抗癌症药物组合,构成背景样本,假设有M组,每次从M组中随机抽取N组,计算特征值的平均值,重复多次,得到多个平均值;利用统计检验,验证这个特征值是否在正样本与随机抽取的样本中有显著的差异,保留具有显著差异的特征;所述的显著差异的特征包括:药物互信息,用于衡量两个药物的靶点群所调控的生物过程的相似性,如果计算得到的特征值越大,表示这两个药物的靶点群所调控的生物过程更为相近;药靶群距离,通过计算两个药物的靶点群之间的平均最短距离,来衡量药物之间距离的远近,如果计算所得特征值越小表示这两个药靶群之间的距离越近;组合药物对靶网络的干预性,用于衡量药物联合使用相对分别单独使用时对癌症网络信号传递效率的干扰程度,如果计算得到的特征值为正值,那么说明组合用药相比单独用药对癌症网络信号传递效率的扰动更大;组合药物效能,结合了药物靶点在癌症网络内外的分布以及网络参数,来衡量药物组合的效能,如果计算所得的特征值越大,则暗示药物组合的效能更佳;药靶群调控的通路群关系,通过对药物各自靶向通路之间的不同关系进行分类,进一步分为:同一条通路,即两条通路完全一样;重叠通路,即两条通路不完全一样,但至少有一个点相同;相互作用通路,即两条通路没有共同点,但是至少存在两个点之间有蛋白相互作用关系;不相关通路,即不满足前面三种情况的通路;所述显著的检验:第一步,首先对每一组正样本,设定药物x和y有差异表达基因分别为m与n个,计算特征值;以表达谱中所有基因作为背景集合,每次随机抽取m与n个基因,同样计算这个特征值;重复这个过程多次,得到多个值;统计这些值中大于真实特征值的次数,由此计算真实特征值出现的概率;仅当概率值小于0.05,才认定这个特征值在这个正样本与随机样本中是有显著区别的;第二步,对这种显著性是否在正样本有富集性进行检验,由正样本中的药物随机组合,构成背景样本,计算正样本K组中特征值有显著性的组数,背景样本中特征值有显著性的组数,将这4个值代入超几何分布,计算概率值,仅当概率值小于0.05,才判定这个特征值在正样本中的显著性是有富集性的;构成过滤系统的两个特征如下:差异基因的重合度DEG_Overlap:DEG_Overlap(x,y)=(|A∩B|)/(|A|×|B|)]]>其中A,B分别表示药物x与药物y的差异表达基因;对特定癌症网络的覆盖度Pathway_Coverage:Pathway_Coverage(x,y)=|(A∪B)∩n||n|]]>其中A,B分别表示药物x与药物y的差异表达基因,n代表待检测癌症的网络中的基因个数。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同济大学,未经同济大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510464329.8/,转载请声明来源钻瓜专利网。
- 上一篇:车辆的后厢门上翻式结构
- 下一篇:一种PVA熬制设备
- 同类专利
- 专利分类
G06 计算;推算;计数
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用