[发明专利]基于字符集变换的自动机空间压缩方法及系统有效
申请号: | 201910505421.2 | 申请日: | 2019-06-12 |
公开(公告)号: | CN110401451B | 公开(公告)日: | 2020-12-04 |
发明(设计)人: | 孙恭鑫;卢毓海;刘燕兵;张春燕;谭建龙;郭莉 | 申请(专利权)人: | 中国科学院信息工程研究所 |
主分类号: | H03M7/30 | 分类号: | H03M7/30;H03M7/40 |
代理公司: | 北京君尚知识产权代理有限公司 11200 | 代理人: | 余长江 |
地址: | 100093 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 字符集 变换 自动机 空间 压缩 方法 系统 | ||
1.一种基于字符集变换的自动机空间压缩方法,其特征在于,包括以下步骤:
将模式串集构建成自动机,并生成状态转移矩阵;
读取状态转移矩阵的各个状态行,计算得到最佳变换参数、最小和最大有效后继状态;
根据状态转移矩阵和最佳变换参数,得到数据结构,根据该数据结构将状态行替换为变换后的有效状态行;
读取目标文本的字符,根据字符当前状态,利用双射函数进行字符变换,得到变换后的字符;
如果目标文本的字符不小于最小有效后继状态,且不大于最大有效后继状态,则得到字符变换后的最终后继状态,实现压缩。
2.如权利要求1所述的方法,其特征在于,根据状态转移矩阵的各个状态行和候选变换参数,计算最小和最大有效后继状态,最小后继状态的计算式为最大有效后继状态的计算式为其中A[·]为状态转移矩阵的状态行,c为目标文本的字符,s为字符当前状态,i为候选变换参数。
3.如权利要求2所述的方法,其特征在于,状态行有效长度Ls,i=sups,i-infs,i+1,记第一个使得Ls,i最小的候选变换参数i为最佳变换参数。
4.如权利要求2所述的方法,其特征在于,候选变换参数i取值范围为从0到255。
5.如权利要求1所述的方法,其特征在于,变换后的有效状态行为其中A[·]为状态转移矩阵的状态行,s为字符当前状态,X[s]为最佳变换参数,fc[s]为参数k下的最小有效后继状态,lc[s]为参数k下的最大有效后继状态。
6.如权利要求1所述的方法,其特征在于,双射函数为其中X[s]为最佳变换参数,c为目标文本的字符,s为字符当前状态。
7.如权利要求1所述的方法,其特征在于,最终后继状态为A[s,c’-fc[s]];其中,A[·]为状态转移矩阵的状态行,s为字符当前状态,c’为变换后的字符;fc[s]为数据结构,包括等于最小有效后继状态。
8.一种基于字符集变换的自动机空间压缩系统,其特征在于,包括:
规则编译器,用于读取、解析模式串集,建立自动机状态转移图,并生成状态转移矩阵;
变换参数生成器,用于生成最佳变换参数;
状态行变换器,用于逐行读取状态转移矩阵,接收最佳变换参数,并对状态行进行变换;
比较器,用于根据变换结果,判断是否应该更新压缩自动机存储器,生成比较结果;
压缩自动机存储器,用于根据比较结果读取上述变换结果,更新内部存储;
状态寄存器,用于存储当前状态;
字符集变换器,用于逐字符读取文本,根据状态寄存器存储的当前状态及压缩自动机中存储的对应的变换参数,对字符进行变换;
文本扫描器,根据状态寄存器存储的当前状态、字符集变换器发送来的字符及压缩自动机中存储的状态行,计算下一个状态并更新状态寄存器。
9.一种存储计算机程序的计算机可读存储介质,其特征在于,该计算机程序包括指令,该指令当由服务器的处理器执行时使得该服务器执行上述权利要求1-7任一所述的方法中的各个步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院信息工程研究所,未经中国科学院信息工程研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910505421.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:神经网络电路
- 下一篇:按键复用电路及其按键复用方法