[发明专利]基于联合约束非负矩阵分解的差异表达基因辨识方法有效
申请号: | 201710232798.6 | 申请日: | 2017-04-11 |
公开(公告)号: | CN107016261B | 公开(公告)日: | 2019-10-11 |
发明(设计)人: | 代凌云;刘金星;郑春厚 | 申请(专利权)人: | 曲阜师范大学 |
主分类号: | G16B25/00 | 分类号: | G16B25/00 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 张勇 |
地址: | 273165 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: |
本发明公开一种基于联合约束非负矩阵分解的差异表达基因辨识方法。1.用非负矩阵X表示癌症基因表达数据集;2.构造对角矩阵Q和元素全1矩阵E;3.在经典的非负矩阵分解方法中引入流形学习,对系数矩阵G施加正交约束稀疏和约束,得到联合约束非负矩阵分解目标函数;4.求解此目标函数,得到基矩阵F和系数矩阵G的迭代公式;5.对非负数据集X进行半监督非负矩阵分解,迭代收敛后得到基矩阵F和系数矩阵G;6.根据基矩阵F得到评估向量 |
||
搜索关键词: | 基于 联合 约束 矩阵 分解 差异 表达 基因 辨识 方法 | ||
【主权项】:
1.一种基于联合约束非负矩阵分解的差异表达基因辨识方法,其特征在于包括如下步骤:(1)将癌症数据集中的数据进行预处理,表示为非负矩阵
j∈[1,n],其中xj表示第j个样本的表达基因构成的列向量,R+表示正实数集合,p表示矩阵X中基因的个数,n表示矩阵X中样本的个数,将X中的所有元素都归一化到(0,1)上;(2)对基矩阵F和系数矩阵G进行非负约束,对系数矩阵G矩阵进行图正则约束,能够保留原始基因表达数据的内在几何信息,对系数矩阵G矩阵进行正交约束,可以得到更加有效稀疏的分解结果,利用L2,1范数约束误差函数来减小异常值和噪声的影响,构建联合约束非负矩阵分解的目标函数:
s.t.F≥0,G≥0,GTG=I,将正交约束引入该目标函数,可得:
其中,F为基矩阵,G为系数矩阵,L为图拉普拉斯矩阵,I为单位阵,|| ||2,1表示矩阵的L2,1范数,|| ||1表示矩阵的L1范数,Tr(·)表示矩阵的迹,α表示图正则约束项Tr(GTLG)的权重,γ表示稀疏约束项的权重,β为正交约束的权重,α,β和γ均为正数;(3)对联合约束非负矩阵分解的目标函数进行优化求解,实现对非负矩阵
进行分解,得到相应的基矩阵
和系数矩阵
其中
表示原始基因表达数据的基空间,其中fi表示第i个样本包含所有的基因信息,
表示低维实数空间Rp×K中全体非负矩阵构成的子集,p为基因的个数,K为降维的维数;
为系数矩阵,
表示实数空间RK×n中全体非负矩阵构成的子集,n为样本的个数,K为分解后的矩阵维数;(4)根据分解得到的基矩阵F,对其中每一行求绝对值的和,得到评估向量
(5)对评估向量
中的元素从大到小进行排序,
中的元素数值越大差异表达程度越高,从而辨识得到差异表达基因;(6)利用基因本体分析工具GO对辨识的差异表达基因进行功能解释。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于曲阜师范大学,未经曲阜师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710232798.6/,转载请声明来源钻瓜专利网。
- 上一篇:液体喷出装置以及液体喷出方法
- 下一篇:液体喷出装置以及液体喷出系统