[发明专利]基于集成学习的全球人类mtDNA发育树分类查询方法有效

专利信息
申请号: 201711426265.8 申请日: 2017-12-26
公开(公告)号: CN108052796B 公开(公告)日: 2021-07-13
发明(设计)人: 周维;彭旻晟;贾俊燕;王文智;向文坤;张亚平 申请(专利权)人: 云南大学
主分类号: G16B20/20 分类号: G16B20/20;G16B20/30;G16B30/10;G16B40/00;G06F16/28;G06K9/62
代理公司: 成都行之专利代理事务所(普通合伙) 51220 代理人: 温利平;陈靓靓
地址: 650091*** 国省代码: 云南;53
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种基于集成学习的全球人类mtDNA发育树分类查询方法,采用人工测得的mtDNA数据训练神经网络分类器,采用mtDNA发育树数据计算朴素贝叶斯分类器的参数,将待分类查询的mtDNA的变异位点序列输入神经网络分类器,得到前Q个可能分类,将待分类查询的mtDNA的变异位点序列和前Q个可能分类的所对应的变异位点序列合并得到朴素贝叶斯分类器的输入变异位点序列,并计算得到该输入变异位点序列中各个变异位点的权重,通过朴素贝叶斯分类器得到前Q个可能分类,然后将两组Q个可能分类的概率进行加权,得到前Q个可能分类作为最终分类结果。本发明综合利用神经网络分类器和朴素贝叶斯分类器的优势,提高了全球人类mtDNA发育树分类查询的正确率。
搜索关键词: 基于 集成 学习 全球 人类 mtdna 发育 分类 查询 方法
【主权项】:
1.一种基于集成学习的全球人类mtDNA发育树分类查询方法,其特征在于,包括以下步骤:S1:人工测得若干mtDNA数据,每条数据包含mtDNA的变异位点序列及对应的最有可能的分类,然后获取全球人类mtDNA发育树数据,包括分类信息及每个分类对应的mtDNA变异位点序列;S2:采用mtDNA数据中的变异位点序列作为输入,对应分类作为期望输出,训练得到神经网络分类器;S3:采用mtDNA发育树数据计算得到朴素贝叶斯分类器的参数,包括第i个分类targeti出现的概率P(targeti)、第j个变异位点mutationj在第i个分类targeti中出现的概率P(mutationj|targeti),i=1,2,…,T,T表示分类数量,j=1,2,…,M,M表示变异位点数量;S4:将待分类查询的mtDNA的变异位点序列mutationsc输入神经网络分类器,得到前Q个可能分类,记该变异位点序列mutationsc属于这Q个可能分类的概率为αq,查询得到这Q个可能分类对应的变异位点序列其中q=1,2,…,Q;将待分类查询的变异位点序列mutationsc与神经网络分类器前Q个可能分类所对应的变异位点序列合并得到变异位点序列mutations′c,计算变异位点序列mutations′c中各个变异位点的权重ωd ω d = β d , c + Σ q = 1 Q α q β d , q ]]>其中,d=1,2,…,D,D表示变异位点序列mutations′c中第d个变异位点,βd,c表示变异位点序列mutations′c中第d个变异位点是否属于变异位点序列mutationsc,如果是βd,c=1,否则βd,c=0;βd,q表示变异位点序列mutations′c中第d个变异位点是否属于Q个可能分类中第q个分类,如果是βd,q=1,否则βd,q=0;将变异位点序列mutations′c及D个权重ωd输入朴素贝叶斯分类器,根据以下公式计算每个分类targeti对应的分类评价值Ri R i = Π d = 1 D P ( mutation d | target i ) * P ( target i ) * ( 1 + Σ d = 1 D ( ω d * target i . mutation d . n ) 2 ( Σ d = 1 D ω d * target i . mutation d . n ) 2 ) ]]>将分类评价值Ri进行降序排列,取前Q个可能分类,记变异位点序列mutations′c属于这Q个可能分类的概率为α′q;按照预设权重对得到的两组Q个可能分类的概率进行加权,按照概率从大到小输出前Q个可能分类。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云南大学,未经云南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201711426265.8/,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top