[发明专利]代码生成方法、代码生成装置以及计算机可读存储介质在审
申请号: | 201580042711.8 | 申请日: | 2015-07-31 |
公开(公告)号: | CN107155361A | 公开(公告)日: | 2017-09-12 |
发明(设计)人: | 陈晓明;M.布拉瓦特;K.盖德克;I.许特尔 | 申请(专利权)人: | 汤姆逊许可公司 |
主分类号: | G06N3/12 | 分类号: | G06N3/12;G11C7/10;G11C13/00;H03M5/14 |
代理公司: | 北京市柳沈律师事务所11105 | 代理人: | 吕晓章 |
地址: | 法国伊西*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 代码 生成 方法 装置 以及 计算机 可读 存储 介质 | ||
1.一种将多个源代码字映射到多个目标代码字的计算机实现的代码本生成方法(100),包括
-提供(101)多个源代码字和多个目标代码字;
-将多个目标代码字分组(102)成目标代码字的多个子集,目标代码字包括识别部分和剩余部分,其中与所述多个子集中的同一子集相对应的目标代码字的识别部分是相同的;
-选择(103)用于寻址所述多个子集的源代码字的第一代码符号集合;
-针对所述子集确定(104)所述多个子集内的一个或多个相应的相邻子集,其中一个或多个相邻子集的目标代码字的识别部分与相应子集的目标代码字的识别部分相差达预定数量的代码符号;以及
-将相应的第一代码符号集合寻址同一子集的源代码字分配(105)到所述子集的目标代码字,使得所述源代码字所分配到的所述子集的目标代码字的数量对应于优化标准,所述子集的目标代码字的剩余部分与所述子集的相邻子集的目标代码字的相应剩余部分相同。
2.根据权利要求1所述的方法,包括:在将多个目标代码字分组成目标代码字的多个子集之前,根据解码相关标准从多个目标代码字中移除目标代码字。
3.根据权利要求2所述的方法,其中,根据解码相关标准,移除(202)包括大于预定义的最大游程长度的相同代码符号的游程长度的目标代码字。
4.根据权利要求3所述的方法,其中,移除(203)当与另一目标代码字链接时包括大于预定义的最大游程长度的相同代码符号的游程长度的目标代码字。
5.根据前述权利要求中任一项所述的方法,其中,所述确定包括:基于核酸链内的核苷酸的测序错误概率,所述一个或多个相邻子集的识别部分与所述相应子集相差达与主导测序错误相对应的所选符号翻转。
6.根据前述权利要求中任一项所述的方法,其中,将多个源代码字和目标代码字划分(204)成第一代码和第二代码的源代码字和目标代码字,第一代码和第二代码的目标代码字都具有以下属性:相应代码的目标代码字的反向互补字仍然属于相应代码,并且在第一代码与第二代码之间没有公共代码字,并且第二代码的目标代码字既不等于两个级联的第一代码的目标代码字的任何部分,也不等于级联的第一代码的一个目标代码字和第二代码的一个目标代码字的任何部分,以及其中所述分组、选择、确定和分配应用于第一代码。
7.根据权利要求6所述的方法,其中,根据以下生成所述第二代码:
-将第二代码的多个目标代码字分组成第二代码的目标代码字的多个子集,第二代码的目标代码字包括识别部分和剩余部分,其中与第二代码的目标代码字的多个子集中的同一子集相对应的第二代码的目标代码字的识别部分是相同的;
-选择用于寻址第二代码的目标代码字的多个子集的第二代码的源代码字的第一代码符号集合;
-根据使第二代码的目标代码字的剩余部分之间的汉明距离最小化的成本函数,将相应的第一代码符号集合寻址第二代码的目标代码字的同一子集的第二代码的源代码字分配到所述子集。
8.根据权利要求7所述的方法,其中,所述成本函数取决于符号错误概率。
9.根据权利要求8所述的方法,其中,所述符号错误概率基于核酸链内的核苷酸的测序错误概率。
10.根据前述权利要求中任一项所述的方法,包括
-从一个或多个目标代码字生成至少一个代码字序列;以及
-合成包括其中核苷酸序列排列为与所述至少一个代码字序列相对应的片段的至少一个核酸分子。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于汤姆逊许可公司,未经汤姆逊许可公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201580042711.8/1.html,转载请声明来源钻瓜专利网。