[发明专利]一种基于比特映射的压缩键树的单词检索方法无效
申请号: | 200810028907.3 | 申请日: | 2008-06-20 |
公开(公告)号: | CN101299212A | 公开(公告)日: | 2008-11-05 |
发明(设计)人: | 罗笑南;麦章灿 | 申请(专利权)人: | 中山大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 510275广东省广州市广州市新*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 比特 映射 压缩 单词 检索 方法 | ||
1.一种基于比特映射的压缩键树的单词检索方法,其特征在于包括以下步骤:
(1)根据单词分布和压缩规则生成非完全压缩的键树,所述压缩规则包括关键字为单字符的结点和关键字为多字符的结点不为兄弟结点,如果某结点的子结点个数大于1,则该结点的所有子结点均为关键字为单字符的结点,如果关键字为Value[i]的树结点TreePoint[i]和关键字为Value[k]的子结点TreePoint[k]可以进行非完全压缩合并,形成新的关键字为STRCAT(Value[i],Value[k])的子树结点TreePoint[i,k],定义其压缩规则如下:TreePoint[i]没有兄弟结点,即TreePoint[i]的父亲结点只有唯一的子结点;TreePoint[i]没有对应的单词,即根结点到TreePoint[i]的路径对应的字符串在词典中没有对应的单词存在,TreePoint[i]没有单词记录指针;TreePoint[k]没有兄弟结点,即TreePoint[i]只有唯一的儿子结点TreePoint[k];
(2)在非完全压缩的键树上采用包括关键字、长子结点的指针、单词记录指针和具有比特映射关系的比特映射码的数据结构;
(3)在基于比特映射关系的键树中进行单词检索,包括根据比特映射码确定下一字符对应的键树节点的指针,根据所述指针进行检索。
2.根据权利要求1所述的一种基于比特映射的压缩键树的单词检索方法,其特征在于关键字为单字符的键树结点都是定长结构形式,关键字为多字符的键树结点是变长的数据流形式。
3.根据权利要求1所述的一种基于比特映射的压缩键树的单词检索方法,其特征在于比特映射码根据词典的字符个数而定,有多少个字符便有多少个比特。
4.根据权利要求1所述的一种基于比特映射的压缩键树的单词检索方法,其特征在于采用了比特映射码的压缩键树,在单词检索的时候,根据键树中的比特映射码的比特流,查找出是否有对应子结点存在。
5.根据权利要求1所述的一种基于比特映射的压缩键树的单词检索方法,其特征在于采用了比特映射码的压缩键树,在单词检索的时候,根据键树中的比特映射码的比特流,不需要经过关键字的比较就能计算出需要检索的下一个结点的位置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810028907.3/1.html,转载请声明来源钻瓜专利网。