[发明专利]线性时间后缀数组构造方法有效
申请号: | 201110393622.1 | 申请日: | 2011-12-01 |
公开(公告)号: | CN102521213A | 公开(公告)日: | 2012-06-27 |
发明(设计)人: | 农革 | 申请(专利权)人: | 农革 |
主分类号: | G06F17/22 | 分类号: | G06F17/22 |
代理公司: | 广州凯东知识产权代理有限公司 44259 | 代理人: | 宋冬涛 |
地址: | 510630 广东省广州市大*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种线性时间后缀数组构造方法,包括:1)从右向左扫描字符串S,比较当前两个相邻字符S[i]和S[i+1],得出每个字符和后缀的类型,记录于数组t[i];2)从左到右扫描t[i],找出所有LMS字符位置,获取所有LMS子串首字母指针,记录于数组P1;3)通过LMS子串指针数组P1、数组B和SA对S中所有的LMS子串进行排序,结果保存SA1中;4)重新命名字符串S中各个LMS子串,形成字符串T1,然后对T1各字符根据其L和S类型进行重命名,形成的新字符串保存到S1;5)判断S1每个字符是否唯一,如果是,则直接排序S1的各后缀来计算S1的后缀数组到SA1中,否则以S1和SA1作为输入参数返回1);6)根据保存于SA1中的S1的后缀数组归纳计算S的后缀数组到SA中;7)返回。 | ||
搜索关键词: | 线性 时间 后缀 数组 构造 方法 | ||
【主权项】:
一种线性时间后缀数组构造方法,其特征在于,它包括:1)标记字符串中每个字符和后缀的类型,从右向左扫描一遍字符串S,按照后缀类型的定义比较当前扫描的两个相邻的字符S[i]和S[i+1],得出每个字符S[i]和后缀suf(S,i)的类型,记录于数组t[i];2)从左到右扫描一遍t[i],找出其中所有LMS字符出现的位置,从而获取所有LMS子串的首字母指针,用数组P1来记录每个LMS子串的指针;3)通过LMS子串指针数组P1、数组B和SA来对S中所有的LMS子串进行排序,结果保存在SA1中;4)根据步骤3)排序的结果重新命名字符串S中的各个LMS子串,形成字符串T1,然后对T1的字符根据其L和S类型进行重命名,形成的新字符串保存到S1;5)判断S1的每个字符是否唯一,如果是,则直接排序S1的各后缀来计算S1的后缀数组到SA1中,否则以S1和SA1作为输入参数,返回到步骤1);6)根据步骤5)中获得的保存于SA1中的S1的后缀数组归纳计算S的后缀数组到SA中;7)返回。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于农革,未经农革许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201110393622.1/,转载请声明来源钻瓜专利网。