[发明专利]文字语言结构树的构建方法无效
申请号: | 200810057398.7 | 申请日: | 2008-02-01 |
公开(公告)号: | CN101499081A | 公开(公告)日: | 2009-08-05 |
发明(设计)人: | 赵文银 | 申请(专利权)人: | 北京乾坤化物数字技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京众合诚成知识产权代理有限公司 | 代理人: | 朱 琨 |
地址: | 100036北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文字 语言 结构 构建 方法 | ||
技术领域
本发明涉及文字语言管理技术和计算机数据结构技术,特别是涉及一种构建文字语言结构树的方法。
背景技术
随着全球信息化进程的不断深入,信息对人们生活的影响也越来越大。
以互联网为例,每天有大量的新信息在Internet上传播,人们通过在网上寻找有价值的信息来创造财富。面对如此庞大并且每天高速增长、杂乱无序的海量信息,如何高效、有序地管理这些信息将变得极其重要。
在现阶段,没有一个很好的方法实现上述的问题。在大多数情况下,人们通过文本索引方式,利用对关键词的管理来建立对海量信息的高效管理。
目前传统的方法比较复杂,也不直观,系统的效率同时受到其它系统比如数据库、硬件等的约束;另外传统的方法在实际应用时,当信息量或者关键词达到一定的数量时,由于硬件和其它系统的制约,大大地增加了计算机的工作量,降低了效率;此外,由于不是采用结构化的管理,而是采用较少的无序关键词信息来管理无序的海量信息的方法,当关键词信息达到一定的数量级时,处理工作量比较大,可扩展性不强。
发明内容
有鉴于此,本发明提供一种文字语言结构树的构建方法,利用该方法可以简单、方便地把文字语言唯一地对应到一个结构树上,把对文字语言的管理转换为对结构树上结点的管理,由于结构的高效性、规律性,大大提高了对文字语言管理的速度,节省了工作量;比如同样采用关键词方式来管理海量信息,由于关键词采用了结构化技术,是可控制范围的有序信息,不受数量的限制,处理速度快并且不受数量的影响,实用性强。
为了实现发明目的,本发明提供一种文字语言结构树的构建方法,该方法包括:
A、文字语言到空间位置的转换规则以及转换;
B、文字语言结构树代码信息的规则设计制定;
C、文字语言结构树代码信息的合成和管理方法;
D、文字语言结构树代码信息的分析识别方法;
E、将文字语言通过计算机或者其它可以计算和存储的设备进行处理,得到文字语言树结点。
所述步骤A包括:
A1、把文字语言映射到N维空间,得到一个唯一的空间位置点P={0,1,2...,N-1};
A2、使用多个空间或者增加空间维数的方法,来解决不同文字语言对应空间中同一个位置点的情况,增加抗“冲突”能力;
所述文字语言到空间的映射是单向的,不能从空间位置还原文字语言;
A3、把空间位置转换为地址段,指定的空间为N维空间,空间位置P共有N个坐标,把N个坐标数值按顺序分成L组,每组M个数字,每组M个数字相加(最大值<L*M),得到L个新的数字,每个数字取Y的余,得到L个小于Y的余数以及L个倍数,余数和倍数按顺序组合,得到一个由整数构成的地址段K;
A4、把地址段转换为树结点,其中主结点为地址段整数值取64的余数,因子结点为地址段取64的倍数;
A5、每2个地址段取64的倍数所得到的结果放在同一个因子结点里。
所述地址段的长度是以2个地址段为增量的,总长度是2的倍数;
从文字语言到树结点的转换是单向的,不能从树结点还原文字语言;
通过增加结构树的层数来降低不同文字语言对应到同一个结点的概率,或者通过为该结点再构建一个子树的方式来降低不同文字语言对应到同一个结点的概率。
所述步骤B包括:
文字语言结构树代码信息包括2个或者多个按顺序排列的数字或字符或者符号,任何一个树结点的代码信息是由分段的独立代码组合而成,任何一个树结点的代码信息含有信息遗传的特征;
文字语言树代码信息执行从左到右顺序。
所述步骤C包括:
C1、代码信息是由分段的独立代码按照顺序排列的集合,文字语言结构树是一组代码
信息构成的集合;
C2、分段代码最多有64个,分别为数字0,1...62,63;
C3、文字语言唯一地映射到结构树上的一个结点;
C4、对文字语言的管理可以通过对代码信息的管理来实现。
所述步骤D包括:
代码信息包括该文字语言在创建过程中其路径的全部信息;
代码信息的识别是通过对分段代码信息以及分段代码所在层的位置的识别来完成的;
一个完整的代码信息的含义是全部的分段代码信息的含义的集合;
代码信息中包含有纵向和横向的位置关系;
代码信息是一张2维表,每个分段代码是表里的一个数据点;
结构树是一个由多张2维表构成的集合。
所述步骤E包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京乾坤化物数字技术有限公司,未经北京乾坤化物数字技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810057398.7/2.html,转载请声明来源钻瓜专利网。