[发明专利]一种基于动态多目标优化的系统发育树构建方法在审
申请号: | 202210094499.1 | 申请日: | 2022-01-26 |
公开(公告)号: | CN114613426A | 公开(公告)日: | 2022-06-10 |
发明(设计)人: | 冯宏伟;王蓓;李燕;刘建妮;冯筠 | 申请(专利权)人: | 西北大学 |
主分类号: | G16B10/00 | 分类号: | G16B10/00 |
代理公司: | 西安恒泰知识产权代理事务所 61216 | 代理人: | 李郑建 |
地址: | 710069 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 动态 多目标 优化 系统发育 构建 方法 | ||
1.一种基于动态多目标优化的系统发育树构建方法,其特征在于,具体步骤如下:
步骤一,对于含有标准树的多组数据使用不同的基于单目标的系统发育树构建方法进行建树,并根据不同优化目标生成的树集合与标准树的RF距离进行目标的排序;
步骤二,通过将真实的古生物形态学数据与模拟数据进行匹配,针对匹配到的数据选取优化目标,动态地得到真实形态学数据的多目标优化建树中的优化目标;
步骤三,通过动态选取的优化目标、非支配排序以及遗传算法进行多目标系统发育树构建,选取最优系统发育树结果集合。
2.如权利要求1所述的方法,其特征在于,所述步骤一的实现方法是:
根据古生物系统发育树中的特点,模拟的一棵二叉系统发育树中所有的叶子节点为分类单元所在的位置;再根据马尔可夫模型模拟生物进化,其中特征间的转换概率相同,生成不同特征数、物种数的特征矩阵:D{X1,X2,…,Xi,…,Xn}
其中,Xi表示第i个物种;物种Xi的第p个形态学特征的状态表示为Xip,用于构建谱系树的物种数记为n,特征数记为m;则物种Xi的特征向量表示如下:
Xi(Xi1,Xi2,…,Xip,...Xiq,...,Xim);
接着,对原始特征矩阵进行随机缺失处理,取不同的缺失率,含有缺失的数据记为Dmissing,其对应的特征矩阵为:Dmissing{X′1,X′2,...,X′i,...,X′n}
对模拟数据取10%、25%、50%、75%的缺失比例,其中,缺失是随机在特征矩阵中选择位点进行的;
分别使用系统发育树构建所使用的简约值、似然值、Fitch值、CI值和RI值,对三种不同的物种数、四种不同的特征数以及四种不同的缺失率的3*4*4=64组数据进行基于单目标优化的系统发育树构建。最终选取最优的系统发育树集合;
将不同优化目标得到的集合与标准树之间计算RF距离,根据RF距离由小到大进行系统发育树集合的优化目标的排序,得到数据与优化目标之间的对应关系。
3.如权利要求1所述的方法,其特征在于,所述步骤二的实现方法是:
将真实的古生物形态学数据与模拟数据进行动态匹配,即首先根据真实数据中物种个数与模拟数据中物种个数的大小,再根据特征的个数进行匹配,然后根据缺失率找到与真实数据集数据大小最接近的模拟数据集;
根据数据匹配结果,将模拟数据最优的前N个目标作为多目标优化中的多个目标,作为之后多目标优化进行树空间搜索的多个依据;根据目标间的先后顺序,首先根据第一个目标进行排序,并以此类推,因此排在越前面的目标越会影响最终的建树结果。
4.如权利要求1所述的方法,其特征在于,所述步骤三的具体实现步骤为:
步骤3.1:初始化树集合
将数据中存在的缺失数据当作一种新的状态进行编码,不可适用数据视为缺失数据进行处理;使用最大简约法和最大似然法交替生成初始树集合;
步骤3.2:遗传算法迭代更新
对生成的初始树集合,通过遗传算法中的交叉算子和变异算子改变树的拓扑结构进行树空间的搜索;通过系统发育树上分支交换,删除,嫁接改变树上分类单元的位置;
步骤3.3:非支配排序
根据不同的优化目标计算目标值并对树进行非支配排序;将n个系统发育树排序为不同的非支配层,第一个非支配层的物种为最优解集,即帕雷托边界;第二层次优,以此类推;并通过非支配排序选取前m个树进行下一次的迭代更新;
步骤3.4:重复步骤3.2至步骤3.3,直至达到迭代终止条件,最终得到最优系统发育树集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北大学,未经西北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210094499.1/1.html,转载请声明来源钻瓜专利网。