[发明专利]基于集成学习的全球人类mtDNA发育树分类查询方法有效
申请号: | 201711426265.8 | 申请日: | 2017-12-26 |
公开(公告)号: | CN108052796B | 公开(公告)日: | 2021-07-13 |
发明(设计)人: | 周维;彭旻晟;贾俊燕;王文智;向文坤;张亚平 | 申请(专利权)人: | 云南大学 |
主分类号: | G16B20/20 | 分类号: | G16B20/20;G16B20/30;G16B30/10;G16B40/00;G06F16/28;G06K9/62 |
代理公司: | 成都行之专利代理事务所(普通合伙) 51220 | 代理人: | 温利平;陈靓靓 |
地址: | 650091*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 集成 学习 全球 人类 mtdna 发育 分类 查询 方法 | ||
1.一种基于集成学习的全球人类mtDNA发育树分类查询方法,其特征在于,包括以下步骤:
S1:人工测得若干mtDNA数据,每条数据包含mtDNA的变异位点序列及对应的最有可能的分类,然后获取全球人类mtDNA发育树数据,包括分类信息及每个分类对应的mtDNA变异位点序列;
S2:采用mtDNA数据中的变异位点序列作为输入,对应分类作为期望输出,训练得到神经网络分类器;
S3:采用mtDNA发育树数据计算得到朴素贝叶斯分类器的参数,包括第i个分类targeti出现的概率P(targeti)、第j个变异位点mutationj在第i个分类targeti中出现的概率P(mutationj|targeti),i=1,2,…,T,T表示分类数量,j=1,2,…,M,M表示变异位点数量;
S4:将待分类查询的mtDNA的变异位点序列mutationsc输入神经网络分类器,得到前Q个可能分类,记该变异位点序列mutationsc属于这Q个可能分类的概率为αq,查询得到这Q个可能分类对应的变异位点序列其中q=1,2,…,Q;
将待分类查询的变异位点序列mutationsc与神经网络分类器前Q个可能分类所对应的变异位点序列合并得到变异位点序列mutations′c,计算变异位点序列修改中各个变异位点的权重ωd:
其中,d=1,2,…,D,D表示待分类查询的变异位点序列mutationsc中变异位点数量,βd,c表示变异位点序列mutations′c中第d个变异位点是否属于变异位点序列mutationsc,如果是βd,c=1,否则βd,c=0;βd,q表示变异位点序列mutations′c中第d个变异位点是否属于Q个可能分类中第q个分类,如果是βd,q=1,否则βd,q=0;
将变异位点序列mutations′c及D个权重ωd输入朴素贝叶斯分类器,根据以下公式计算每个分类targeti对应的分类评价值Ri:
将分类评价值Ri进行降序排列,取前Q个可能分类,记变异位点序列mutations′c属于这Q个可能分类的概率为α′q;
按照预设权重对得到的两组Q个可能分类的概率αq和α′q进行加权,按照概率从大到小输出前Q个可能分类。
2.根据权利要求1所述的全球人类mtDNA发育树分类查询方法,其特征在于,所述步骤S2中,在对神经网络分类器进行训练之前,先对mtDNA数据进行预处理,其具体方法为:采用哈希算法对mtDNA数据中的每条数据的变异位点序列进行数值化,存入预设长度的数组中,得到变异位点向量,将分类转化为独热向量得到分类向量。
3.根据权利要求2所述的全球人类mtDNA发育树分类查询方法,其特征在于,所述哈希算法为BKDRHash算法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云南大学,未经云南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711426265.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:齿轮齿条中心驱动的多层楼房用电梯
- 下一篇:一种组装式栏杆