[发明专利]基于大数据的融合基因数据检测方法、计算机程序、终端在审

专利信息
申请号: 201810843915.7 申请日: 2018-07-27
公开(公告)号: CN109033755A 公开(公告)日: 2018-12-18
发明(设计)人: 赵宝昌;张吉梅 申请(专利权)人: 泰山医学院
主分类号: G06F19/24 分类号: G06F19/24;G06F19/22;G06F19/28
代理公司: 北京科亿知识产权代理事务所(普通合伙) 11350 代理人: 汤东凤
地址: 271016 *** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明属于基因技术领域,公开了一种基于大数据的融合基因数据检测方法、计算机程序、终端,将已知的融合基因断裂点以及断裂点前面的N个序列和断裂点后面的M个序列组成种子,种子的集合形成融合基因数据库;采用试剂盒提取待检测基因的RNA;利用反转录试剂盒,对所提取的RNA进行反转录,获得待检测基因的cDNA;利用PCR扩增仪,以cDNA为模板,通过聚合酶链式反应进行扩增,获得融合基因片段;通过基因检测技术相对待检测基因片段进行检测,获得待检测基因信息。本发明根据判断结果对待比对序列进行比对,能够有效提升基因序列比对效率,提升用户体验。
搜索关键词: 融合基因 断裂点 检测 比对 计算机程序 数据检测 大数据 终端 聚合酶链式反应 反转录试剂盒 基因检测技术 融合基因片段 基因技术 基因片段 基因信息 基因序列 判断结果 用户体验 基因 反转录 试剂盒 扩增 数据库 集合
【主权项】:
1.一种基于大数据的融合基因数据检测方法,其特征在于,所述的基于大数据的融合基因数据检测方法,包括:将已知的融合基因断裂点以及断裂点前面的N个序列和断裂点后面的M个序列组成种子,种子的集合形成融合基因数据库;采用试剂盒提取待检测基因的RNA;利用反转录试剂盒,对所提取的RNA进行反转录,获得待检测基因的cDNA;利用PCR扩增仪,以cDNA为模板,通过聚合酶链式反应进行扩增,获得融合基因片段;通过基因检测技术相对待检测基因片段进行检测,获得待检测基因信息;基因检测中,利用相关度和冗余度的概念定义一组最小化的目标函数,用以评价融合基因片段数据信息特征子集的质量;其中相关度倾向保留所有与数据结构关联紧密的特征,而冗余度则会排除与已选特征相关度高的特征;二者作为膜粒群算法的适应度函数;相关度目标采用熵度量指标,如下:sij=exp(‑aDij),其中,N是融合基因片段数据信息样本的个数;a是权重系数,Dij是样本i和样本j在x所表示的特征子集下的欧式距离;Da表示所有样本在全空间下欧式距离的平均值。Sij的取值必须归一化到[0,1];当选择的特征子集合理时,样本i和样本j若属于同类,则Sij的取值很小,反之越大;从而f1(x)选取最小值;冗余度目标则利用相关系数,当相关系数绝对值越小,特征子集所包含的冗余越小;目标函数如下:其中,nx表示融合基因片段数据信息特征子集的个数;d是总的特征个数;xj和xk分别表示x中第j个和第k个元素的取值;bij表示第i个样本在第j个特征上的取值,baj表示所有样本在第j个特征上的均值。因此,在特征子集规模确定时,冗余度小的特征子集对应的目标函数f2(x)越小;通过大数据资源对待检测基因信息的数据进行处理;选取若干个待检测基因信息干扰信号的特征参数CP,包括无线信号的频率F、时间T、对于观测点空域角度Θ、极化方向Γ、以及编码方式C,并将参数作为坐标轴建立多维坐标系,对于坐标系的各个坐标轴,分别根据各个干扰特征参数的分辨率确定对应坐标轴的单位量,基于坐标系建立多维特征参数的空间模型,为干扰空间:HSI=SPACE(CP1,CP2…CPN),在此干扰空间中的任意一个矢量由坐标进行表示:其中CPi为矢量在干扰空间中某一维度的坐标,是对于特征参量CPi的具体取值,对于单模的待检测基因信息干扰信号,在干扰空间中表示为一个单一矢量:对于多模的待检测基因信息干扰信号,干扰信号的一个或者数个特征参数表现为具有多值特性,在干扰空间中使用干扰特征矢量的集合表示:通过与融合基因数据库中融合基因的信息进行对比,判断待检测基因序列是否与数据库中的信息相同;融合基因数据库包含待检测基因包含种子信息时,则认为待检测基因内含有融合基因;否则认为不包含融合基因。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于泰山医学院,未经泰山医学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201810843915.7/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top