[发明专利]基于大数据的融合基因数据检测方法、计算机程序、终端在审
申请号: | 201810843915.7 | 申请日: | 2018-07-27 |
公开(公告)号: | CN109033755A | 公开(公告)日: | 2018-12-18 |
发明(设计)人: | 赵宝昌;张吉梅 | 申请(专利权)人: | 泰山医学院 |
主分类号: | G06F19/24 | 分类号: | G06F19/24;G06F19/22;G06F19/28 |
代理公司: | 北京科亿知识产权代理事务所(普通合伙) 11350 | 代理人: | 汤东凤 |
地址: | 271016 *** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明属于基因技术领域,公开了一种基于大数据的融合基因数据检测方法、计算机程序、终端,将已知的融合基因断裂点以及断裂点前面的N个序列和断裂点后面的M个序列组成种子,种子的集合形成融合基因数据库;采用试剂盒提取待检测基因的RNA;利用反转录试剂盒,对所提取的RNA进行反转录,获得待检测基因的cDNA;利用PCR扩增仪,以cDNA为模板,通过聚合酶链式反应进行扩增,获得融合基因片段;通过基因检测技术相对待检测基因片段进行检测,获得待检测基因信息。本发明根据判断结果对待比对序列进行比对,能够有效提升基因序列比对效率,提升用户体验。 | ||
搜索关键词: | 融合基因 断裂点 检测 比对 计算机程序 数据检测 大数据 终端 聚合酶链式反应 反转录试剂盒 基因检测技术 融合基因片段 基因技术 基因片段 基因信息 基因序列 判断结果 用户体验 基因 反转录 试剂盒 扩增 数据库 集合 | ||
【主权项】:
1.一种基于大数据的融合基因数据检测方法,其特征在于,所述的基于大数据的融合基因数据检测方法,包括:将已知的融合基因断裂点以及断裂点前面的N个序列和断裂点后面的M个序列组成种子,种子的集合形成融合基因数据库;采用试剂盒提取待检测基因的RNA;利用反转录试剂盒,对所提取的RNA进行反转录,获得待检测基因的cDNA;利用PCR扩增仪,以cDNA为模板,通过聚合酶链式反应进行扩增,获得融合基因片段;通过基因检测技术相对待检测基因片段进行检测,获得待检测基因信息;基因检测中,利用相关度和冗余度的概念定义一组最小化的目标函数,用以评价融合基因片段数据信息特征子集的质量;其中相关度倾向保留所有与数据结构关联紧密的特征,而冗余度则会排除与已选特征相关度高的特征;二者作为膜粒群算法的适应度函数;相关度目标采用熵度量指标,如下:sij=exp(‑aDij),其中,N是融合基因片段数据信息样本的个数;a是权重系数,Dij是样本i和样本j在x所表示的特征子集下的欧式距离;Da表示所有样本在全空间下欧式距离的平均值。Sij的取值必须归一化到[0,1];当选择的特征子集合理时,样本i和样本j若属于同类,则Sij的取值很小,反之越大;从而f1(x)选取最小值;冗余度目标则利用相关系数,当相关系数绝对值越小,特征子集所包含的冗余越小;目标函数如下:其中,nx表示融合基因片段数据信息特征子集的个数;d是总的特征个数;xj和xk分别表示x中第j个和第k个元素的取值;bij表示第i个样本在第j个特征上的取值,baj表示所有样本在第j个特征上的均值。因此,在特征子集规模确定时,冗余度小的特征子集对应的目标函数f2(x)越小;通过大数据资源对待检测基因信息的数据进行处理;选取若干个待检测基因信息干扰信号的特征参数CP,包括无线信号的频率F、时间T、对于观测点空域角度Θ、极化方向Γ、以及编码方式C,并将参数作为坐标轴建立多维坐标系,对于坐标系的各个坐标轴,分别根据各个干扰特征参数的分辨率确定对应坐标轴的单位量,基于坐标系建立多维特征参数的空间模型,为干扰空间:HSI=SPACE(CP1,CP2…CPN),在此干扰空间中的任意一个矢量由坐标进行表示:其中CPi为矢量在干扰空间中某一维度的坐标,是对于特征参量CPi的具体取值,对于单模的待检测基因信息干扰信号,在干扰空间中表示为一个单一矢量:对于多模的待检测基因信息干扰信号,干扰信号的一个或者数个特征参数表现为具有多值特性,在干扰空间中使用干扰特征矢量的集合表示:通过与融合基因数据库中融合基因的信息进行对比,判断待检测基因序列是否与数据库中的信息相同;融合基因数据库包含待检测基因包含种子信息时,则认为待检测基因内含有融合基因;否则认为不包含融合基因。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于泰山医学院,未经泰山医学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810843915.7/,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06 计算;推算;计数
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用