[发明专利]一种用于电子病历属性约简的自适应蛙群进化树设计方法有效
申请号: | 201210139741.9 | 申请日: | 2012-05-08 |
公开(公告)号: | CN102682210A | 公开(公告)日: | 2012-09-19 |
发明(设计)人: | 丁卫平;王建东;董建成;管致锦;施佺 | 申请(专利权)人: | 南通大学 |
主分类号: | G06F19/00 | 分类号: | G06F19/00;G06Q50/24 |
代理公司: | 南京正联知识产权代理有限公司 32243 | 代理人: | 顾伯兴 |
地址: | 226000 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 电子 病历 属性 自适应 进化 设计 方法 | ||
1.一种用于电子病历属性约简的自适应蛙群进化树设计方法,其特征在于:具体步骤如下:
A、采用属性空间映射关系 ,构造电子病历相应病症的形式背景并映射至蛙群进化种群空间,建立其电子病历属性约简进化目标优化模型,将病历最小属性约简优化问题转化为进化蛙群结点的目标寻优问题;
B、将电子病历属性集划分成进化子树:初始时先将原电子病历属性集随机划分成若干具有进化子树度的进化子树,执行时不断优化每次划分的各进化子树执行记录,计算其相应的动态选择概率并调整为有序序列;然后根据新的进化子树度重新将电子病历属性集划分为若干棵新的进化子树,再将病历属性集中各病症属性分配至各棵子树的结点上,参与进化树的迭代寻优;
C、设计一种自适应蛙群进化树动态寻优结构:在电子病历属性集划分的各棵进化子树上建立一种自适应蛙群进化树动态寻优结构,进化子树中每个病历属性结点视为混合蛙跳算法SFLA中每一蛙个体,这样即将病历属性约简优化问题转化为进化树中蛙群结点的寻优问题,通过子树上属性进化结点的动态调整和反复迭代,将蛙群进化树逐步由“胖树”变为“瘦树”,最后优选出每一棵蛙群进化树的精英个体;
D、构建进化向量,将电子病历属性子集分配至,其中表示划分的子树大小,为病历属性各棵子树中进化出的精英个体结点;
E、利用混合蛙跳算法SFLA和当前各棵进化子树的精英个体分别对各电子病历划分的属性子集进化,并在各棵子树间进行适应度共享;
F、 计算病历进化子树上最好适应度目标函数值,取次划分子树所形成的进化树平均最优适应度为全局最优适应度值,即;
G、求出上述每次所形成的属性进化子树最优适应度相应的病历最优属
性约简集为,以及电子病历全局最优属性约简集为;
H、计算电子病历属性约简率,并判断其是否满足约简精度要求,其中为0.85,如满足约简精度,则整个病历属性约简循环终止,否则继续重复上述进化树的约简寻优迭代,直至满足约简精度要求。
2.根据权利要求1所述一种用于电子病历属性约简的自适应蛙群进化树设计方法,其特征在于:所述步骤B中的具体步骤如下:
(1)、首先根据电子病历属性集中属性数随机分配一组进化子树度集合;
(2)、在进化树的根结点下以相应的进化子树度构造各棵进化子树,并创建一组每次构造进化子树执行记录,其中 与其相应的相对应,计算公式如下:
其中为该进化子树当前迭代各结点中最好适应度,为当前迭代各结点中最差适应度;
(3)、对进化子树,如果,转到上一步继续执行,其中,是一个用来优化执行记录的预先设定阈值;每次迭代时记录每棵进化子树中结点最好适应度和最差适应度,并更新其相应的,以此在每个进化子树中反复执行直至达到进化子树最优;
(4)、计算该进化树所形成的进化子树选择概率集,与其相应进化子树度下优化后的执行记录相对应,其计算方法如下:
该选择概率集既能提供较高的概率去选择那些具有较好执行能力的进化子树,同时对总体执行相对较差进化子树也提供一定的机会,可使整棵属性进化树中进化结点保持较好的均匀分布性;
(5)、将进化子树选择概率集中所有按从大到小排序,形成新的选择概率有序集,并依据中每个调整中与其相对应的子树选择度的顺序,最终形成优化后划分进化子树度的集合;
(6)、每次属性进化时选择上述进化子树度集中,将电子病历属性约简集划分成棵进化子树,病历属性集中各个病症属性分配至各棵子树结点上,形成病历属性进化子树为。
3.根据权利要求1所述一种用于电子病历属性约简的自适应蛙群进化树设计方法,其特征在于:所述步骤C中的具体步骤如下:
(1)、构建蛙群进化正序树:在电子病历属性划分到的各个进化子树中,将所有参与病历属性约简的病症属性个体置为进化子树上的每个蛙结点,设蛙群进化树的高度为,进化子树度依次选取上述进化子树选择度集合中的值,进化树中结点总数为;
属性约简过程为了利用取得最好适应度的优秀蛙结点,将在上述每一棵蛙群进化子树内部采用竞争机制优选出精英个体并不断上下跳动寻优,最终形成一棵蛙群进化正序树,其设计方法如下:
① 在每一次创建蛙群进化树的过程中,对蛙群进化树中每个蛙结点对象计算其属性适应度目标函数值;
② 对每一棵蛙群进化子树,从树底到树顶逐步形成各棵进化子树,将所属第层的每个孩子结点(为第层孩子结点的编号)适应度相互竞争比较,优选出第层优秀精英蛙个体为,并将该进化子树的双亲蛙结点与精英蛙进行适应度比较,如果,则进化子树中孩子精英蛙个体将与双亲结点位置互换,始终保持每棵子树的双亲结点为该进化子树最优适应度蛙结点;
③ 上述比较和交换在各棵划分的进化蛙群子树中按照从树底到树顶采用递归方式逐步进行,经过次上下迭代交换后,将建立了一棵蛙群进化“正序”树,即树中形成的每棵子树根结点适应度总是小于其所有孩子的适应度,整棵进化树的结点适应度从上至下逐步增加,最后整棵进化树的根结点将存储当前全局最优精英进化蛙个体;
(2)、自适应调整蛙群进化树:所有进化蛙被置为上述树型结构的每个结点上,由于进化子树的选择度集是一个优化后的有序集合,其对整个种群的进化自适应调整步骤如下:
① 对初始建立的蛙群进化树,比较大,大部分属性进化蛙个体均靠近树的根结点,整棵树的深度相对较小,可进行广度搜索,进化树是一棵“胖树”,整个进化开始时收敛速度快,具有较强的全局搜索能力,但其鲁棒性相对较弱;
② 随着整棵属性蛙群进化树的逐步进化,进化树选择度逐步变小,大部分属性结点上的进化蛙个体将远离进化树的根结点,向深度探索,则逐步变大,进化树逐步变成是一棵“瘦树”,这时进化树虽搜索能力相对较慢,但其具有较强的全局搜索性,鲁棒性也较好;
③ 在属性蛙群进化树由“胖树”逐步进化到“瘦树”的过程中,对每棵属性进化子树中具有最低适应度的进化蛙个体,将其从原进化子树的第层叶子结点上移至层叶子结点;
④ 对上述进化树的各棵子树分别构造其蛙群进化正序树,通过反复优化调整,最后输出整棵正序树的根结点,即为全局最优精英进化个体。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南通大学,未经南通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210139741.9/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用