[发明专利]一种为基因数据库确定最佳序列比对阈值的方法有效
申请号: | 202011117987.7 | 申请日: | 2020-10-19 |
公开(公告)号: | CN112365930B | 公开(公告)日: | 2022-06-10 |
发明(设计)人: | 刘思彤;潘珏君;陈倩 | 申请(专利权)人: | 北京大学 |
主分类号: | G16B30/10 | 分类号: | G16B30/10;G16B40/00;G16B50/00 |
代理公司: | 北京智绘未来专利代理事务所(普通合伙) 11689 | 代理人: | 郭红燕 |
地址: | 100871*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种为基因数据库确定最佳序列比对阈值的方法,包括:1)获取蛋白质序列;2)从蛋白质序列中移除被包括在基因数据库中的序列,创建假基因数据集;3)将基因数据库中的蛋白质序列划分子类,作为真基因数据集;4)合并假基因数据集与真基因数据集,针对任意一条蛋白质序列,模拟高通量测序所产生的特定长度的DNA序列,得到模拟数据集;5)进行序列比对,对比对阈值进行取值;6)判定序列比对结果,计算真阳性、错配、假阳性、假阴性、真阴性的数量;7)计算灵敏度、准确度和马修斯相关系数;8)以相似度为X轴,E值为Y轴,灵敏度、准确度或马修斯相关系数为Z轴,绘制三维曲面图;9)在三维曲面图确定基因数据库的最佳序列比对阈值。 | ||
搜索关键词: | 一种 基因 数据库 确定 最佳 序列 阈值 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202011117987.7/,转载请声明来源钻瓜专利网。