[发明专利]构造后缀数组的方法、终端设备及计算机可读存储介质在审
申请号: | 202110042806.7 | 申请日: | 2021-01-13 |
公开(公告)号: | CN112765938A | 公开(公告)日: | 2021-05-07 |
发明(设计)人: | 周杰;农革 | 申请(专利权)人: | 中山大学 |
主分类号: | G06F40/126 | 分类号: | G06F40/126 |
代理公司: | 深圳中一联合知识产权代理有限公司 44414 | 代理人: | 任敏 |
地址: | 510275 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 构造 后缀 数组 方法 终端设备 计算机 可读 存储 介质 | ||
1.一种构造后缀数组的方法,其特征在于,包括:
获取目标字符串的信息以及当前终端设备的信息;
确定与所述目标字符串的信息以及所述当前终端设备的信息相匹配的目标后缀数组构造方式;
获取所述目标后缀数组构造方式对应的样本集;所述样本集中的每条样本数据均由一个样本字符串对应的样本后缀数组构造条件以及适用于所述样本后缀数组构造条件的性能最优的后缀数组构造算法组成,所述样本后缀数组构造条件包括所述样本字符串的信息以及构造所述样本字符串的后缀数组时所使用的样本终端设备的信息;
从所述样本集中确定与所述目标字符串的信息以及所述当前终端设备的信息对应的性能最优的目标后缀数组构造算法;
采用所述目标后缀数组构造算法构造所述目标字符串的后缀数组。
2.根据权利要求1所述的构造后缀数组的方法,其特征在于,所述目标字符串的信息包括所述目标字符串的字符串大小和重复度;
相应地,所述获取目标字符串的信息,包括:
获取所述目标字符串的字符串大小;
对所述目标字符串依次进行字符串分割操作和字符串采样操作,得到所述目标字符串的多个采样字符串;
采用预设的字符串相似度算法计算每两个所述采样字符串之间的第一相似度值,并基于所述第一相似度值确定所述目标字符串的重复度。
3.根据权利要求2所述的构造后缀数组的方法,其特征在于,所述当前终端设备的信息包括所述当前终端设备的内核数目和内存容量;
相应地,所述确定与所述目标字符串的信息以及所述当前终端设备的信息相匹配的目标后缀数组构造方式,包括:
若所述目标字符串的字符串大小大于所述当前终端设备的内存容量,则将外存后缀数组构造方式确定为所述目标后缀数组构造方式;
若所述目标字符串的字符串大小小于或等于所述当前终端设备的内存容量,且所述当前终端设备的内核数目等于1,则将串行后缀数组构造方式确定为所述目标后缀数组构造方式;
若所述目标字符串的字符串大小小于或等于所述当前终端设备的内存容量,且所述当前终端设备的内核数目大于1,则将并行后缀数组构造方式确定为所述目标后缀数组构造方式。
4.根据权利要求1至3任一项所述的构造后缀数组的方法,其特征在于,所述从所述样本集中确定与所述目标字符串的信息以及所述当前终端设备的信息对应的性能最优的目标后缀数组构造算法,包括:
将所述目标字符串的信息以及所述当前终端设备的信息作为所述目标字符串对应的目标后缀数组构造条件;
从所述样本集中确定与所述目标后缀数组构造条件相匹配的样本后缀数组构造条件;
基于与所述目标后缀数组构造条件相匹配的样本后缀数组构造条件所适用的性能最优的后缀数组构造算法,确定所述目标后缀数组构造算法。
5.根据权利要求4所述的构造后缀数组的方法,其特征在于,所述从所述样本集中确定与所述目标后缀数组构造条件相匹配的样本后缀数组构造条件,包括:
计算所述目标后缀数组构造条件与所述样本集中的各个样本后缀数组构造条件之间的第二相似度值;
将满足预设条件的所述第二相似度值对应的样本后缀数组构造条件确定为与所述目标后缀数组构造条件相匹配的样本后缀数组构造条件。
6.根据权利要求4所述的构造后缀数组的方法,其特征在于,所述基于与所述目标后缀数组构造条件相匹配的样本后缀数组构造条件所适用的性能最优的后缀数组构造算法,确定所述目标后缀数组构造算法,包括:
将与所述目标后缀数组构造条件相匹配的各个样本后缀数组构造条件所适用的性能最优的后缀数组构造算法中,占比最高的后缀数组构造算法确定为所述目标后缀数组构造算法。
7.根据权利要求4所述的构造后缀数组的方法,其特征在于,所述构造后缀数组的方法还包括:
将所述目标后缀数组构造条件与所述目标后缀数组构造算法组成一条新的样本数据,并将所述新的样本数据添加至所述样本集中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110042806.7/1.html,转载请声明来源钻瓜专利网。