[发明专利]基于联合约束非负矩阵分解的差异表达基因辨识方法有效

专利信息
申请号: 201710232798.6 申请日: 2017-04-11
公开(公告)号: CN107016261B 公开(公告)日: 2019-10-11
发明(设计)人: 代凌云;刘金星;郑春厚 申请(专利权)人: 曲阜师范大学
主分类号: G16B25/00 分类号: G16B25/00
代理公司: 济南圣达知识产权代理有限公司 37221 代理人: 张勇
地址: 273165 山*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开一种基于联合约束非负矩阵分解的差异表达基因辨识方法。1.用非负矩阵X表示癌症基因表达数据集;2.构造对角矩阵Q和元素全1矩阵E;3.在经典的非负矩阵分解方法中引入流形学习,对系数矩阵G施加正交约束稀疏和约束,得到联合约束非负矩阵分解目标函数;4.求解此目标函数,得到基矩阵F和系数矩阵G的迭代公式;5.对非负数据集X进行半监督非负矩阵分解,迭代收敛后得到基矩阵F和系数矩阵G;6.根据基矩阵F得到评估向量对评估向量中的元素从大到小进行排序,得到差异表达基因;7.通过GO工具对辨识的差异表达基因进行检测分析。本发明能够有效提取癌症数据集中的差异表达基因,能用于发现人类疾病基因数据库中的差异特征,对癌症的早期诊断和针对性治疗有重要的临床意义。
搜索关键词: 基于 联合 约束 矩阵 分解 差异 表达 基因 辨识 方法
【主权项】:
1.一种基于联合约束非负矩阵分解的差异表达基因辨识方法,其特征在于包括如下步骤:(1)将癌症数据集中的数据进行预处理,表示为非负矩阵j∈[1,n],其中xj表示第j个样本的表达基因构成的列向量,R+表示正实数集合,p表示矩阵X中基因的个数,n表示矩阵X中样本的个数,将X中的所有元素都归一化到(0,1)上;(2)对基矩阵F和系数矩阵G进行非负约束,对系数矩阵G矩阵进行图正则约束,能够保留原始基因表达数据的内在几何信息,对系数矩阵G矩阵进行正交约束,可以得到更加有效稀疏的分解结果,利用L2,1范数约束误差函数来减小异常值和噪声的影响,构建联合约束非负矩阵分解的目标函数:s.t.F≥0,G≥0,GTG=I,将正交约束引入该目标函数,可得:其中,F为基矩阵,G为系数矩阵,L为图拉普拉斯矩阵,I为单位阵,|| ||2,1表示矩阵的L2,1范数,|| ||1表示矩阵的L1范数,Tr(·)表示矩阵的迹,α表示图正则约束项Tr(GTLG)的权重,γ表示稀疏约束项的权重,β为正交约束的权重,α,β和γ均为正数;(3)对联合约束非负矩阵分解的目标函数进行优化求解,实现对非负矩阵进行分解,得到相应的基矩阵和系数矩阵其中表示原始基因表达数据的基空间,其中fi表示第i个样本包含所有的基因信息,表示低维实数空间Rp×K中全体非负矩阵构成的子集,p为基因的个数,K为降维的维数;为系数矩阵,表示实数空间RK×n中全体非负矩阵构成的子集,n为样本的个数,K为分解后的矩阵维数;(4)根据分解得到的基矩阵F,对其中每一行求绝对值的和,得到评估向量(5)对评估向量中的元素从大到小进行排序,中的元素数值越大差异表达程度越高,从而辨识得到差异表达基因;(6)利用基因本体分析工具GO对辨识的差异表达基因进行功能解释。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于曲阜师范大学,未经曲阜师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201710232798.6/,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top