[发明专利]转录组解析装置及解析方法在审
申请号: | 201910022338.X | 申请日: | 2019-01-10 |
公开(公告)号: | CN110033823A | 公开(公告)日: | 2019-07-19 |
发明(设计)人: | 近藤聪;大音德;阿部圆佳;青木直大;A·福田;广濑龙郎;永野惇 | 申请(专利权)人: | 丰田自动车株式会社;国立大学法人东京大学;国立研究开发法人农业·食品产业技术总和研究机构;学校法人龙谷大学 |
主分类号: | G16B25/10 | 分类号: | G16B25/10;G06N20/00 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 11038 | 代理人: | 郑天松 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据集 转录组 解析 基因表达量 解析装置 预测式 碱基序列数据 变量数据 转录产物 随机地 正则化 削减 基因 应用 | ||
本发明涉及转录组解析装置及解析方法。本发明中旨在使用关于转录产物的碱基序列数据而进行更高精度的转录组解析。本发明中生成对于含目的变量数据和基因表达量数据的多个数据集随机地削减基因表达量数据而得到的多个子数据集,对于多个子数据集应用正则化法而算出各自预测式,生成预测式中所含的基因的列表。
【技术领域】
本发明涉及对关于转录组的信息进行解析的转录组解析装置及解析方法。
【背景技术】
作为基于基因表达而预测生物的表现型的尝试,已知从基因表达数据和表现型数据重回归分析的方法(非专利文献1及专利文献1)。在非专利文献1中公开的方法中,为了使基因表达数据的重复消失,对于相同的操纵子而应用仅表达水平最高的数据等而限定基因表达数据。
即便如此,转录组,一般而言,是指存在于指定的状态或条件下的组织或细胞内的全部转录产物。转录组含来自基因组上的编码区域的转录产物(即,mRNA)和来自非编码区域的转录产物(所谓的ncRNA)。通过对转录组进行解析,可得到因环境要因导致的基因表达的变动、与表现型关联表达的基因的鉴定等基于基因的表达状态的新的见解。
在解析转录组时,例如,将存在于组织或细胞内的转录产物应用微阵列技术或下一代测序技术而整体测量。测量的数据是大量的碱基序列数据,是典型的大数据。
作为统计学解析得到的数据的方法,如在专利文献2中公开,已知应用作为多变量解析的一方法的主成分分析的方法。在所述方法中,通过对于训练数据(不是由分析得到的碱基序列数据)进行主成分分析,可导出在条件不同的样品间能比较的结果。
另外,作为转录组解析法,如在专利文献3中公开,已知从基因表达信息(状态变量)和性状信息(特性变量)生成解析对象的特性变量推定模型的方法。在专利文献3中公开的方法中,以特性变量作为目的变量(从属变量)、以状态变量的各自作为说明变量,生成有正则化项的回归模型。作为回归模型的算出式,例示LASSO回归(Least AbsoluteShrinkage and Selection Operator)。
即便如此,LASSO回归是指为了防在统计学或机器学习的领域中的过度拟合而使用的正则化的一方法(L1型正则化法),是将大量的数据之中不重要的数据的参数设为0,从数据删除的基于稀疏正则化法的回归建模(非专利文献2)。
【现有技术文献】
【专利文献】
【专利文献1】WO2016/148107
【专利文献2】专利第5854346号
【专利文献3】特开2017-51118号公报
【非专利文献】
【非专利文献1】Nature Communications 5,Article number:5792(2014)
【非专利文献2】Robert Tibshirani,Journal of the Royal StatisticalSociety.Series B(Methodological)Vol.58,No.1(1996),pp.267-288
【发明的概要】
【发明要解决的课题】
即便如此,由于在上述的转录组解析中,与解析对象的样品数比较,得到了碱基序列数据的转录产物的数极其大,因此在非专利文献1中公开的方法中难以得到充分地有含意的解析结果。另外,对于应用在专利文献3中公开的LASSO回归分析的解析方法,即使在与解析对象的样品数比较而得到碱基序列数据的转录产物的数是极其大时也期待良好的解析结果。但是,在转录组解析中,要求解析结果的进一步的精度提升。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于丰田自动车株式会社;国立大学法人东京大学;国立研究开发法人农业·食品产业技术总和研究机构;学校法人龙谷大学,未经丰田自动车株式会社;国立大学法人东京大学;国立研究开发法人农业·食品产业技术总和研究机构;学校法人龙谷大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910022338.X/2.html,转载请声明来源钻瓜专利网。