[发明专利]位标记字符串检索技术有效

专利信息
申请号: 200510057491.4 申请日: 2005-09-13
公开(公告)号: CN101488127A 公开(公告)日: 2009-07-22
发明(设计)人: 徐文新 申请(专利权)人: 徐文新
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 暂无信息 代理人: 暂无信息
地址: 200433上海市杨浦区邯郸路*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明是一种字符串检索技术,以一个位(bit)对应若干个字符元,以n个位对应全部字符元,也就是分全部字符元为n组,并用一个数据的n个均为0的位,记为W,来标记组字符串的字符元信息。如果字符串S的一个字符元P1属于第n组,则将W相应的第n个位标记为1,类似地,根据S其它字符元P2、P3、P4…所属的组对W进行标记,完成全部字符元标记后的W,记录有S的信息,称为S的“位值”,这种方式称为1标记。根据逻辑代数的原理,也可用一个数据的n个均为1的位,记为,来标记组成字符串的字符元信息。如果S的一个字符元P属于第n组,则将数据相应的第n个位标记为0,这种方式称为0标记。通过对Sa的“位值”Waa与Sb的“位值”Wbb进行比较,可以判断Sb不包含、包含或可能包含检索关键词Sb的所有字符元。例如,对Wa与Wb进行位蕴含运算,如果所有的位都有蕴含关系,则Sb包含或可能包含“Sa的所有字符元”。如果需要,再用字符逐位比较方法判断Sb是否包含“Sa”。位标记既可用于通常意义的检索,即判断数据库字符串是否包含关键词,也可以作“逆检索”,就是判断关键词是否包含数据库字符串,可用于语音输入、拼音输入及汉语分词中,匹配基本句型或词语。如果可用于标记的位数n,是字符串的平均长度m的2倍以上,可以用数个位(bit)的组合对应一组字符元进行标记,可以提高筛选效率,称为多位标记。多位标记,同样可用字符逐位比较方法最终判断字符串Sb是否包含“Sa”。位标记字符串检索技术作为一种字符串算法,不仅可用于数据库的字符串查找,也可用于各种数据结构的字符串查找。
搜索关键词: 标记 字符串 检索 技术
【主权项】:
1.一种字符串糊检索技术,其特征在于:W指一个数据的n个均为0的位(bit),用W来标记构成字符串的字符元信息,以其中j个位(j=1,2,3,…)为一个组合,则共有个位的组合,相应地分全部字符元为组,以一个位的组合对应一组字符元,进行标记。如果若干个字符串S的一个字符元P1属于第r组,则将W的构成第r个位的组合的j个位标记为1,类似地,根据S的其它字符元P2、P3、P4…所属的组对W进行标记,完成全部字符元标记后的W,记录有S的字符元信息,称为若干个字符串S的“位值”,此种方式称为1标记。W指一个数据的n个均为1的位(bit),用W来标记构成字符串的字符元信息,以其中j个位(j=1,2,3,…)为一个组合,则共有个位的组合,相应地分全部字符元为组,以一个位的组合对应一组字符元,进行标记。如果若干个字符串S的一个字符元P1属于第r组,则将W的构成第r个位的组合的j个位标记为0,类似地,根据S的其它字符元P2、P3、P4…所属的组对W进行标记,完成全部字符元标记后的W,记录有S的字符元信息,称为若干个字符串S的“位值”,此种方式称为0标记。记Sa的1标记“位值”为Wa,记Sa的0标记“位值”为Wa,记Sb的1标记“位值”为Wb,记Sb的0标记“位值”Wb,下面方法均可用于字符串比较:或者,I.Sa和Sb均用1标记,以Wa与Wb进行比较,如果所有Wa为1的位,Wb相应的位也为1,则Sb包含(含等于,下同)或可能包含Sa的所有字符元。或者,II.Sa和Sb均用0标记,以Wb与Wa进行比较,如果所有Wb为1的位,Wa相应的位也为1,则Sb包含或可能包含Sa的所有字符元。或者,III.Sa用1标记而Sb用0标记,以Wa与Wb进行比较,如果Wb与Wa所有相应的位,不同时为1,则Sb包含或可能包含Sa的所有字符元。或者,IV.Sa用0标记而Sb用1标记,以Wa与Wb进行比较,如果Wa与Wb所有相应的位,不同时为0,则Sb包含或可能包含Sa的所有字符元。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于徐文新,未经徐文新许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/200510057491.4/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top