[发明专利]基于改进PSO算法的基因表达数据聚类方法在审
申请号: | 201610861263.0 | 申请日: | 2016-09-29 |
公开(公告)号: | CN106446603A | 公开(公告)日: | 2017-02-22 |
发明(设计)人: | 郑相涵;刘煜;陈日清;于元隆 | 申请(专利权)人: | 福州大学 |
主分类号: | G06F19/18 | 分类号: | G06F19/18;G06K9/62 |
代理公司: | 福州元创专利商标代理有限公司35100 | 代理人: | 蔡学俊 |
地址: | 350108 福建省福州市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种基于改进PSO算法的基因表达数据聚类方法,主要包括以下步骤:1、构建基因聚类矩阵:对基因芯片数据进行处理后构建基因表达矩阵,再计算基因间的欧式距离构建基因距离矩阵;2、优化PSO算法聚类:把基因距离矩阵带入优化后的PSO算法获取一条最优路径,对根据给定阈值进行划分得到聚类模块;3:聚类结果优化:去掉单独成簇的基因以及过于稀疏的聚类,得到最终的基因聚类结果。粒子群算法是通过模拟鸟群觅食行为而发展起来的一种基于群体协作的随机搜索算法,相对于其他聚类算法具有较大的优势,所以将其应用到基因表达数据聚类分析领域上,能根据基因表达数据,对基因进行准确、快速的聚类。 | ||
搜索关键词: | 基于 改进 pso 算法 基因 表达 数据 方法 | ||
【主权项】:
一种基于改进PSO算法的基因表达数据聚类方法,其特征在于,包括以下步骤:步骤S1:对基因芯片数据进行0‑1标准化后,建立基因表达矩阵,然后再计算基因间的欧式距离,把基因表达矩阵转化为距离矩阵,距离矩阵相对于对角线对称,基因间的距离表示基因的相似程度;步骤S2对于每个粒子,随机选取0~n之间的整数k,其中n为基因的个数,求出其余各基因到基因k之间的距离作为当前粒子的初始位置,粒子群中初始群体最优位置是以各基因到中心基因的距离作为粒子群体历史最优位置;步骤S3:将惯性权重w设为可调因子:,将学习因子c2也设为可调因子:,其中a为当前迭代次数,b为总迭代次数;步骤S4:原始的基因表达数据聚类算法中,当获得最初优化路径时,仅仅根据给定阀值D对路径进行剪枝,获得初始基因聚类;再对聚类的结果进行进一步优化,去掉单独成簇的基因以及过于稀疏的聚类,得到最终的基因聚类结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610861263.0/,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06 计算;推算;计数
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用