[发明专利]基于信息熵筛选单细胞数据敏感性基因的方法在审

专利信息
申请号: 202110113321.2 申请日: 2021-01-27
公开(公告)号: CN114822686A 公开(公告)日: 2022-07-29
发明(设计)人: 陈泽川;郝沛;张晓明 申请(专利权)人: 上海大学;中国科学院上海巴斯德研究所
主分类号: G16B20/20 分类号: G16B20/20;G16B40/30;G06K9/62
代理公司: 上海一平知识产权代理有限公司 31266 代理人: 马莉华;徐迅
地址: 200444*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 信息 筛选 单细胞 数据 敏感性 基因 方法
【说明书】:

发明提供了一种基于信息熵筛选单细胞数据敏感性基因的方法及基于其的单细胞聚类分析方法和系统。具体地,包括:S1.接收单细胞测序数据的初次无监督聚类分析结果;S2.1根据所述无监督聚类分析结果,计算每个簇中各基因的变异系数,并将所述变异系数在簇内排名;S2.2保留在一自定义比例的簇内均具有高变异系数的基因;S2.3计算所述具有高变异系数的基因在每个簇中的平均表达量x,用于计算信息熵H(x);S2.4将某一基因的信息熵H(x)与一自定义的信息熵阈值X比较,从而得到敏感性基因筛选结果。使用本发明的方法可筛选敏感基因,从而进行单细胞测序数据的降噪,进而优化无监督聚类分析结果。

技术领域

本发明涉及生物信息学领域,具体涉及一种基于信息熵筛选单细胞数据敏感性基因的方法及基于其的单细胞聚类分析方法和系统。

背景技术

单细胞转录组测序技术(Single cell RNA sequencing;scRNA-seq)[1]是一种用于研究组成成分复杂或者细胞异质性较强的组织,例如大脑或者肿瘤组织等。相比于传统的转录组测序技术(Bulk RNA sequencing),scRNA-seq能够高通量且精准的对单个细胞进行外显子测序(同一个体不同细胞的DNA均一样,但是RNA的表达情况并不一样)。随着进行全面的scRNA-seq实验的技术进步,分析来自成千上万个细胞的高通量数据以提取生物学相关信息是相当具有挑战性的。单细胞转录组数据的分析主要有以下几个步骤:序列比对、条形码(Barcode)比对和UMI去重、质量控制(去除低质量的细胞)、数据标准化、高变基因(HVGs)筛选、数据降维以及无监督聚类。scRNA-seq的分析目的主要包括:寻找新的未知的细胞亚型;研究疾病与正常状态下细胞亚型发生的变化;健康组织微环境中各种细胞类型之间的互相作用;正在发育分化的细胞亚型之间如何通过基因的表达的逐步变化实现细胞分化过程等。其中对于单细胞转录组分析来说,最主要的一点就是要能够精准的鉴定细胞亚型。通常来说,现在对于细胞亚型的注释主要依据两种方法,一种是根据已知细胞类型的基因对无监督聚类得到的分群进行注释;另一种是通过基于同种细胞类型之间的相似性构建算法对每个细胞进行单独注释。但是通过基于组织相似性的算法进行自动注释时常常会由于样本组织高度异质性的问题以及参考数据不具有广泛性等问题,自动注释软件在对细胞亚型进行注释时,往往得不到非常理想的结果,大部分单细胞分析依旧是根据已知的Markers对无监督聚类结果进行注释。无监督聚类结果的好坏,往往对单细胞转录组数据分析结果的准确性有决定性作用。

单细胞转录组测序技术虽然能够使从单细胞水平上获取转录表达谱,使能够区分细微的生物学差异,但是在scRNA-seq数据中,往往含有较强的技术噪音。由于实验因素、组织状态、测序时间、试剂等造成的单细胞数据表达谱发生变化时,发现部分基因的表达情况会发生较大波动,甚至于掩盖细胞亚型之间的差异。对于这种随机表达且对细胞亚型分类影响不利的基因,称之为敏感性基因。敏感性基因由于表达的随机性从而被识别为高变异基因(HVGs)时,则会对细胞的无监督聚类结果造成一定的不良影响,进一步影响分析结果的准确性。

传统的单细胞分析方法中:首先,其分析流程中并不会单独对单细胞数据中的敏感性基因进行定义,从而无法将随机基因表达造成的功能差异从真正的生物学差异中剔除出去,分析时会由于敏感性基因的存在造成细胞亚型注释结果的精确度不够,造成细胞类型误判并进一步影响后续分析的结果。此外,敏感性基因的随机扰动会造成无意义亚群的产生或者有意义的亚群被掩盖等情况,对于稀有的新细胞亚型研究极为不利。

因此,本领域急需提供一种能够有效降低数据噪音,结果更准确的聚类分析方法。

发明内容

本发明的目的是提供一种基于信息熵筛选单细胞数据敏感性基因的方法及系统。

本发明另一目的是提供一种根据敏感基因进行数据降噪,从而优化无监督聚类结果的聚类分析方法和系统。

本发明第一方面,提供了一种筛选单细胞数据中敏感性基因的方法,所述方法包括步骤:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海大学;中国科学院上海巴斯德研究所,未经上海大学;中国科学院上海巴斯德研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110113321.2/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top