[发明专利]一种基于matK基因的未知植物物种识别数据库的构建方法及数据库有效
申请号: | 202010319607.1 | 申请日: | 2020-04-21 |
公开(公告)号: | CN111681704B | 公开(公告)日: | 2022-06-17 |
发明(设计)人: | 宁康;白虹;杨朋硕;卢璟详;邹欣桐;李洪军 | 申请(专利权)人: | 华中科技大学鄂州工业技术研究院;华中科技大学 |
主分类号: | G16B20/00 | 分类号: | G16B20/00;G06K9/62;G16B50/00 |
代理公司: | 北京众达德权知识产权代理有限公司 11570 | 代理人: | 刘杰 |
地址: | 436044 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 matk 基因 未知 植物 物种 识别 数据库 构建 方法 | ||
一种基于matk基因的未知植物物种识别数据库的构建方法及数据库,所述方法包括步骤:获取含有matk基因的原始序列数据文件;提取所述原始序列数据文件中的物种注释信息;将所述物种注释信息整合至所述matK基因上,以得到matK序列;对所述matk序列进行质量控制;根据所述matk序列之间的相似性进行聚类;根据聚类结果构建所述数据库。本申请提供的一种基于matk基因的未知植物物种识别数据库的构建方法及数据库优点为:(1)检测通量高;(2)高灵敏度和选择性;(3)该方法所构建的数据库覆盖面广、数据质量高、信息全面;(4)可以利用生物信息学方法在物种的水平上确定未知物种。
技术领域
本发明属于植物物种鉴定领域,具体涉及一种基于matk基因的未知植物物种识别数据库的构建方法及数据库。
背景技术
matK基因存在于叶绿体赖氨酸trnK基因内,且位于高度保守的两个外显子中间的内含子中,是单拷贝的编码基因,参与编码转录本内被II型内含子剪切的成熟酶,进化速度介于rbcL和ITS之间,在科、属水平上具有较高的物种鉴定能力。2009年,matK基因和rbcL基因一起被生物条形码联盟(CBOL)以测序质量、物种鉴定效率和通用性为衡量标准推荐成为植物DNA条形码相关研究的核心DNA条形码。
尽管matk基因有着较出色的物种鉴定效率、通用性以及测序质量,但由于其扩增的引物通用性较差,导致在不同类群中使用matk基因通常需要使用不同的引物。李德铢等人采用单一的引物在6,286个样品里的PCR扩增效率仅仅为79.5%,是全部DNA条形码候选序列中PCR扩增效率最低的,而采用16对引物组合来对matK基因进行PCR扩增,其扩增效率为91.2%。
目前,大部分基于样本研究的植物DNA条形码研究项目都使用两类方法。第一类是针对单个或多个质体区域进行研究,比如研究非编码间隔区的DNA条形码trnH-psbA和蛋白质编码DNA条形码,也被称为“核心条形码”的rbcL基因和matk基因;第二类方法则是针对属于细胞核核糖体的DNA内部转录间隔区域进行研究,这一类研究可以选择整个ITS区域或只选择ITS2区域。而对于以混合模板或者被降解过的DNA为目标的植物研究,则通常情况下使用质体trnL内含子的P6环进行研究,由于其长度较短且具有保守的引物序列,因此,非常适合经下一代测序技术进行短读测序和扩增。
由于DNA稳定存在于个体的所有组织中,且不受外界因素的影响,可以准确地在物种水平上鉴定物种。目前,DNA条码在发现新的物种、调查植物区系领域、重建历史植被类型、研究群落系统、辅助执法部门等领域均有应用。目前,已经有一系列生物标志物被应用于物种鉴定,如matk、trnL、ITS2、psbA-trnH、COI等。研究者们应针对不同的研究对象以选择最合适的条码,他们与其他技术手段也可以被用作辅助用途,用来增加使用DNA条形码进行物种识别的成功率和可靠性。目前已经存在的数据库已经可以满足大部分研究者的需求。支持以matk基因进行物种鉴定的数据库目前有用于采集、发布、存储、分析DNA条形码记录的BOLD和包含可药用的植物,真菌,昆虫和动物的DNA条形码的MMDBD等数据库,覆盖范围广,数据质量高,保证了物种识别的准确性。
但是当识别未知植物物种时,仍然缺少一种准确、高效、覆盖范围大的数据库。
发明内容
本发明提供一种基于matK基因的未知植物物种识别数据库的构建方法及数据库,解决了现有技术中当识别未知植物物种时,仍然缺少一种准确、高效、覆盖范围大的数据库的问题。
为解决上述技术问题,本发明提供了一种基于matK基因的未知植物物种识别数据库的构建方法,所述方法包括步骤:
获取含有matK基因的原始序列数据文件;
提取所述原始序列数据文件中的物种注释信息;
将所述物种注释信息整合至所述matk基因上,以得到matk序列;
对所述matk序列进行质量控制;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学鄂州工业技术研究院;华中科技大学,未经华中科技大学鄂州工业技术研究院;华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010319607.1/2.html,转载请声明来源钻瓜专利网。