[发明专利]一种基于mtDNA遗传信息聚类分析的区域人口结构分析方法无效

申请号：	201210049757.0	申请日：	2012-02-29
公开（公告）号：	CN102629255A	公开（公告）日：	2012-08-08
发明（设计）人：	张虎勤;刘芳娥;吴晓明;杜建强;夏娟娟;刘晓刚;郭燕	申请（专利权）人：	西安交通大学
主分类号：	G06F17/30	分类号：	G06F17/30;G06N3/12
代理公司：	西安智大知识产权代理事务所 61215	代理人：	弋才富
地址：	710048***	国省代码：	陕西;61
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于 mtdna 遗传信息聚类分析区域人口结构分析方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及遗传信息研究区域人口结构的技术领域，特别涉及一种基于mtDNA遗传信息聚类分析的区域人口结构分析方法。

背景技术

人口结构和组成与结构，通常是以民族、性别、年龄等因素为指标进行宏观统计学分析和汇总，对人口结构的认识停留在直观信息的统计分析上，存在工作量大，统计信息误差大等缺点。尝试从分子水平和基因序列信息表征区域人口的结构和特征，使区域人口打上分子特征标示，为区域人口成分界定和类群界定提供新的技术通道已经成为研究的热点。

发明内容

为了克服上述现有技术的缺陷，本发明的目的在于提供一种基于mtDNA遗传信息聚类分析的区域人口结构分析方法，用遗传算法和k-modes模型嵌合的聚类算法对区域人群mtDNA序列进行聚类分析，实现对区域人口结构进行类群标识和类群结构划分，以mtDNA多态性位点标识人口类别聚类分析方法力求提高遗传算法收敛速度搜索性能，达到高稳定性的聚类分析结果。

为了实现上述任务，本发明采取如下的技术解决方案：

一种基于mtDNA遗传信息聚类分析的区域人口结构分析方法，包括下列步骤：

步骤一、选择样本来源：根据数据库资源信息量，选择mtDNA高变I区长度为350bp序列，选择mtDNA高变I区在16026-16399区间序列，长度为350bp，进行聚类分析，依据数据库提供的原始数据，随机选取所选区域内的人口mtDNA数据在这个区间内具有完整信息的样本100-200个；

步骤二、构建遗传算法的K-modes聚类嵌合的分析模型：

遗传算法以个体适应度的大小来确定该个体被遗传到下一代群体中的概率，在遗传K-modes算法中，采用聚类紧密度指标作为个体的适应度值，个体S的适应度函数定义为：

f(s)=1nΣj=1,kΣSi∈CjDist(Si,Zj)---(1)]]>