[发明专利]基于多层级结构相似度的单基因病名称推荐方法和系统有效
申请号: | 202010123773.4 | 申请日: | 2020-02-27 |
公开(公告)号: | CN111341458B | 公开(公告)日: | 2020-11-03 |
发明(设计)人: | 马旭;曹宗富;陈翠霞;喻浴飞;蔡瑞琨;李乾;罗敏娜 | 申请(专利权)人: | 国家卫生健康委科学技术研究所 |
主分类号: | G16H50/70 | 分类号: | G16H50/70 |
代理公司: | 北京市万慧达律师事务所 11111 | 代理人: | 黄玉东 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 多层 结构 相似 基因 名称 推荐 方法 系统 | ||
1.一种基于多层级结构相似度的单基因病名称推荐方法,其特征在于,包括:
根据单基因病名称的特征关系数据库,构建单基因病的标准化临床特征表型树;
将用户输入的特征集合I中的临床特征在标准化临床特征表型树上的节点标记;
遍历特征关系数据库中的第n个单基因病名称,将其对应特征集合A中的标准临床特征在标准化临床特征表型树上的节点标记,所述n的初始值为1;
基于标准化临床特征表型树上的节点标记,从特征集合A中匹配出与特征集合I每个临床特征对应的最佳标准临床特征;
根据每个临床特征与对应的最佳标准临床特征的相似度值,计算出特征集合I与当前特征集合A的集合相似度值;
令n=n+1重新遍历特征关系数据库中的第n个单基因病名称,直至特征关系数据库中的单基因病名称遍历完毕,将特征集合I与每个特征集合A对应的集合相似度值汇总排序,输出最高相似度值对应的单基因病名称;
基于标准化临床特征表型树上的节点标记,从特征集合A中匹配出与特征集合I中每个临床特征对应的最佳标准临床特征的方法包括:
所述特征集合I包括多个临床特征,所述特征集合A包括多个标准临床特征;
遍历所述特征集合I中的第i个临床特征,从所述特征集合A中筛选出与所述第i个临床特征相似度最高的标准临床特征,作为与所述第i个临床特征对应的最佳标准临床特征,所述i的初始值为1;
令i=i+1后重新遍历所述特征集合I中的第i个临床特征,直至特征集合I中的临床特征遍历完毕,从第n个单基因病名称对应的特征集合A中筛选出与特征集合I中临床特征一一对应的多个最佳标准临床特征;
从所述特征集合A中筛选出与所述第i个临床特征相似度最高的标准临床特征的方法包括:
遍历所述特征集合A中的第j个标准临床特征,基于已建立的索引判断所述第j个标准临床特征与所述第i个临床特征是否存在相同的干节点Bt,所述j的初始值为1;
若判断结果为否,则认为所述第j个标准临床特征与所述第i个临床特征的相似度值为零;
若判断结果为是,基于多层级结构相似度算法计算所述第j个标准临床特征与所述第i个临床特征的相似度值;
令j=j+1后重新遍历所述特征集合A中的第j个标准临床特征,并继续执行所述第j个标准临床特征与所述第i个临床特征的相似度计算,直至所述特征集合A中的标准临床特征遍历完毕,对应得到与所述特征集合A中标准临床特征一一对应的多个相似度值;
从多个相似度值筛中筛选出最大值对应的标准临床特征作为与第i个临床特征对应的最佳标准临床特征;
基于多层级结构相似度算法计算所述第j个标准临床特征与所述第i个临床特征的相似度值的方法包括:
基于标准化临床特征表型树上的节点标记,获取第i个临床特征与相同干节点Bt连接通路中所有节点的有向集合IB,以及获取第j个标准临床特征与相同干节点Bt连接通路中所有节点的有向集合AB,所述有向集合IB长度的值为通路中节点的个数LIB,所述有向集合AB长度的值为通路中节点的个数LAB;
提取所述有向集合IB和所述有向集合AB中节点的交集IAB,所述交集IAB长度的值为通路中共有节点的个数LIAB;
采用公式计算所述第j个标准临床特征与所述第i个临床特征的相似度值;其中,
所述SM表示所述第j个标准临床特征与所述第i个临床特征在表型树多层次间的相似度值;
所述SI表示所述第j个标准临床特征与所述第i个临床特征在表型树同层次间的相似度值,所述β为权重系数。
2.根据权利要求1所述的方法,其特征在于,根据单基因病名称的特征关系数据库的方法包括:
从单基因病的公共数据库和文献数据库,获得已知的单基因病名称及其对应的标准临床特征;
基于已知的单基因病名称及其对应的标准临床特征,建立单基因病名称与标准临床特征的特征关系数据库;
分别计算每种单基因病名称对应的各标准临床特征对该单基因病的贡献度ci。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家卫生健康委科学技术研究所,未经国家卫生健康委科学技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010123773.4/1.html,转载请声明来源钻瓜专利网。