[发明专利]基于SAT及OBDD桶消元的蛋白质分类方法在审
申请号: | 201810463426.9 | 申请日: | 2018-05-15 |
公开(公告)号: | CN108664768A | 公开(公告)日: | 2018-10-16 |
发明(设计)人: | 徐周波;戴瑀君;梁轩瑜;宁黎华;刘桂珍;张鵾;杨健;黄文文 | 申请(专利权)人: | 桂林电子科技大学 |
主分类号: | G06F19/24 | 分类号: | G06F19/24 |
代理公司: | 桂林市持衡专利商标事务所有限公司 45107 | 代理人: | 陈跃琳 |
地址: | 541004 广西*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 蛋白质分类 求解 算法 蛋白质 布尔可满足性问题 符号操作 符号技术 候选模式 基数约束 技术应用 模式挖掘 频繁序列 求解算法 求解效率 搜索空间 算法执行 特征信息 元素位置 约束关系 决策图 再使用 构建 分类 挖掘 分析 研究 | ||
1.基于SAT及OBDD桶消元的蛋白质分类方法,其特征是,具体包括步骤如下:
步骤1、根据给定的蛋白质序列以及最小支持度阈值,使用命题变量来表示候选模式中元素的位置,使用基数约束推导候选模式的支持度,建立蛋白质分类的SAT模型;
步骤2、将步骤1所建立的SAT模型的所有约束子句转化为布尔函数表述形式,并运用OBDD的运算和化简规则,将所有约束子句表示为OBDD形式,得到SAT模型的符号OBDD表示;
步骤3、根据步骤2所得的SAT模型的符号OBDD表示,在桶消元算法的基础上,通过OBDD的符号操作来求解SAT。
2.根据权利要求1所述的基于SAT及OBDD桶消元的蛋白质分类方法,其特征是,步骤1中,SAT模型包括以下3种约束表示:
第一约束:第一个符号必须是一个固定的字符;
第二约束:由二进制子句组成的约束获取候选模式不存在的位置;
第三约束:在枚举相对于最小支持度阈值λ的所有频繁模式问题中,需要候选模式至少出现λ次。
3.根据权利要求2所述的基于SAT及OBDD桶消元的蛋白质分类方法,其特征是,第三约束通过基数约束获得。
4.根据权利要求2或3所述的基于SAT及OBDD桶消元的蛋白质分类方法,其特征是,步骤4的具体步骤如下:
步骤4.1、对SAT模型的第二约束的所有约束子句中的变量,根据该变量与其他变量之间的约束关系的个数进行递增排序,得到变量序π:y0<y1<…<yn-1;
步骤4.2、对SAT模型的第二约束的所有约束子句,当变量yi为约束子句cj的约束范围中变量序最小的变量时,则将约束子句cj合并到OBDD变量bucket[yi]中;
步骤4.3、基于变量序π,对SAT模型的第二约束的所有约束子句中的变量进行消元,即:
步骤4.3.1、根据OBDD的量化操作从OBDD变量bucket[y0]中消去变量y0,并得到新的约束子句g0,此时变量y1为新的约束子句g0中变量序最小的变量,则将新的约束子句g0加入到OBDD变量bucket[y1]中;
步骤4.3.2、在消去变量y0后,根据OBDD的量化操作从OBDD变量bucket[y1]中消去变量y1,并得到新的约束子句g1,此时变量y2为新的约束子句g1中变量序最小的变量,则将新的约束子句g1加入到OBDD变量bucket[y2]中;
以此类推;
步骤4.3.n-1、在消去变量yn-3后,根据OBDD的量化操作从OBDD变量bucket[yn-2]中消去变量yn-2,并得到新的约束子句gn-2,此时只剩变量yn-1,则将新的约束子句gn-2加入到OBDD变量bucket[yn-1]中;
步骤4.4、从变量OBDD变量bucket[yn-1]开始到OBDD变量bucket[y0]结束,即根据变量序的逆序将OBDD变量bucket[yi]逐个进行合取,最后所得到的OBDD变量即为满足第二约束的所有解的OBDD表示;
步骤4.5、对第一约束的所有约束子句、满足第二约束的所有解以及第三约束的所有约束子句进行OBDD的与操作,所得的OBDD即为满足所有约束的SAT模型的所有解,由此完成蛋白质分类;
上述i=0,1,…,n-1,n为第二约束中变量的个数,j=1,2,…,m,m为第二约束中约束子句的条数。
5.根据权利要求4所述的基于SAT及OBDD桶消元的蛋白质分类方法,其特征是,步骤4.2和4.3中,通过OBDD的与操作将约束合并到OBDD变量中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于桂林电子科技大学,未经桂林电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810463426.9/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用