[发明专利]一种基于局部异常因子的拷贝数变异检测方法在审
申请号: | 201910381315.8 | 申请日: | 2019-05-08 |
公开(公告)号: | CN110310704A | 公开(公告)日: | 2019-10-08 |
发明(设计)人: | 袁细国;李俊萍;李杰;张军英;杨利英;习佳宁 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G16B30/00 | 分类号: | G16B30/00;G16B40/00 |
代理公司: | 西安长和专利代理有限公司 61227 | 代理人: | 黄伟洪 |
地址: | 710071 陕西省*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明属于数据异常程度检测技术领域,公开了一种基于局部异常因子的拷贝数变异检测方法;本发明首先对数据进行预处理,减少了测序过程中带来的误差;本发明使用局部异常因子的算法将低敏感度的拷贝数变异区域的特征凸显出来,更容易,更准确的检测出低敏感度的拷贝数变异位置;操作简单,本发明只需要bam文件和参考序列即可完成检测,并且检测速度较快。同时,通过仿真数据的测试,可以发现本发明的测试结果相对于其它方法来说更为准确。本发明针对低敏感度区域的检测与现有方法做对比,正确率较高。现有技术对于低敏感度的拷贝数变异的检测造成遗漏,而本发明通过使用局部异常因子算法将该类型的变异区域的特征凸显出来,可以准确的检测出变异区域。 | ||
搜索关键词: | 拷贝数 低敏感度 异常因子 检测 变异区域 变异检测 算法 预处理 参考序列 测序过程 程度检测 仿真数据 数据异常 正确率 遗漏 测试 发现 | ||
【主权项】:
1.一种基于局部异常因子的拷贝数变异检测方法,其特征在于,所述基于局部异常因子的拷贝数变异检测方法包括以下步骤:第一步,从bam文件中提取出每个窗口的read depth值;将一维read depth值进行scaling计算,scaling计算首先将数据进行0均值归一化处理,将read depth处理成大于0的值和小于0的值,之后将read depth小于0的窗口进行某倍数的扩增;第二步,对处理完的数据进行segment计算,将散乱的数据分割成长度不等的几个片段;将segment后的一维read depth数据加上位置信息转化成二维数据;第三步,用局部异常因子检测算法对产生的数据进行计算;通过局部异常因子算法将产生的一维read depth值转化成一组score值,通过score的值,很容易找到变异区域;第四步,获取了一组score值,使用箱形算法针对本组score值将较大的数据筛选;第五步,得到变异区域,确定变异是丢失还是增添。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910381315.8/,转载请声明来源钻瓜专利网。
- 上一篇:药物的预测方法、装置及计算机设备
- 下一篇:支持SIMD的序列比对方法及装置