[发明专利]用于生物标记识别的系统和方法在审
申请号: | 201880029975.3 | 申请日: | 2018-05-11 |
公开(公告)号: | CN110603597A | 公开(公告)日: | 2019-12-20 |
发明(设计)人: | W·J·耶森 | 申请(专利权)人: | 美国控股实验室公司 |
主分类号: | G16B50/00 | 分类号: | G16B50/00;C12Q1/6886 |
代理公司: | 11038 中国国际贸易促进委员会专利商标事务所 | 代理人: | 周衡威 |
地址: | 美国北*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据库项 网络模型 关联 生物标记 预定项 子集 计算机实现 生物信息学 生物医学 识别候选 数据挖掘 预定次序 算法 文本 查询 开发 | ||
1.一种用于识别生物标记的方法,所述方法包括:
通过计算设备,使用查询对生物医学文本、科学摘要或生物信息学数据的一个或多个公共来源进行数据挖掘,以识别与一个或多个预定项相关联的数据库项;
通过所述计算设备,对识别出的数据库项中的每个数据库项与所述一个或多个预定项之间的一个或多个关联进行评分;
通过所述计算设备,基于识别出的数据库项中的每个数据库项与所述一个或多个预定项之间的所述一个或多个关联的得分来确定子集b;
通过所述计算设备,按预定次序使用算法的组合来开发相互作用网络模型,所述相互作用网络模型包括相互作用、附加数据库项以及所述子集b中的数据库项,其中所述相互作用网络模型是使用包括特定于组织或器官的参数的预设参数来开发的,所述特定于组织或器官的参数将所述相互作用和所述附加数据库项限制到具体的组织或器官;以及
通过所述计算设备,基于所述相互作用网络模型中的所述附加数据库项以及所述子集b中的数据库项的排名,从所述相互作用网络模型中识别候选生物标记。
2.如权利要求1所述的方法,还包括:
通过所述计算设备,擦洗识别出的数据库项以移除不是“实际”关注的数据库项的所谓数据库项,以生成仅包括“实际”关注的数据库项的子集a;以及
通过所述计算设备,生成所述子集b的列表,所述列表包括识别出的数据库项的名称、识别出的数据库项的标识符或符号、以及每个识别出的数据库项与所述一个或多个预定项之间的所述一个或多个关联的得分。
3.如权利要求1所述的方法,还包括:通过所述计算设备,使用统计处理来验证所述相互作用网络模型。
4.如权利要求3所述的方法,其中,所述验证包括使用统计数据来证明所述附加数据库项以及子集b中的数据库项在包括人类基因-疾病关联的独立第三方数据源中的富集。
5.如权利要求1所述的方法,其中,开发所述相互作用网络模型包括:
对子集b中的数据库项应用增长算法以在上游构建包括所述附加数据库项的5-50个节点,其中在该增长算法中排除相关性和表达关系;
对子集b中的数据库项应用增长算法以在下游构建包括所述附加数据库项的5-50个节点,其中在该增长算法中排除相关性和表达关系;
使用直接连接算法将在给定预设参数的情况下能够直接连接的所有节点连接起来以创建核心网络,其中在该直接连接算法中排除相关性和表达关系;
对所述核心网络应用用于找出节点之间的最短路径的算法,以识别直接连接和其中还有一个附加步骤的连接,其中在用于找出最短路径的所述算法中排除相关性和表达关系;
对所述核心网络中在给定所述预设参数的情况下能够直接连接的所有节点应用直接连接算法,其中,该直接连接算法中排除相关性和表达关系;以及
对所述核心网络应用用于找出最短路径的所述算法,以识别直接连接和其中还有一个附加步骤的连接,其中相关性和表达关系被包括在用于找出最短路径的该算法中。
6.如权利要求1所述的方法,还包括:
通过计算设备,识别第一数据集和第二数据集之间的交集,其中所述第一数据集包括来自所述相互作用网络模型的所述附加数据库项和子集b中的数据库项的列表以及具有现有的经过验证的测定的已知测试分析物的列表;以及
通过所述计算设备,基于包括第一数据集和第二数据集之间的交集的标准,将子集b中的数据库项和所述附加数据库项作为候选生物标记进行排名。
7.权利要求6的方法,其中,所述标准包括:排名1候选生物标记,排名1候选生物标记是被一个或多个治疗专家独立地推荐作为“生物标记”的那些数据库项;排名2候选生物标记,排名2候选生物标记是通过数据挖掘识别出的并且是所述相互作用网络模型的组成部分的那些数据库项,诸如基因或蛋白质;以及排名3候选生物标记,排名3候选生物标记是非排名1且非排名2候选生物标记的那些数据库项。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于美国控股实验室公司,未经美国控股实验室公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201880029975.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:基因组数据分析系统和方法
- 下一篇:菜单显示方法、菜单显示装置和菜单显示程序