[发明专利]位标记字符串检索技术有效
申请号: | 200510057491.4 | 申请日: | 2005-09-13 |
公开(公告)号: | CN101488127A | 公开(公告)日: | 2009-07-22 |
发明(设计)人: | 徐文新 | 申请(专利权)人: | 徐文新 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 200433上海市杨浦区邯郸路*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 标记 字符串 检索 技术 | ||
1.一种字符串模糊检索方法,其特征在于:
用具有n个均为0的位(bit)的数据W来标记构成字符串的字符元信息,以其中j个位 为一个组合,则共有个位的组合,相应地分全部字符元为组,以一个位 的组合对应一组字符元,进行标记;如果字符串S的一个字符元P1属于第r组,则将W 的构成第r个位的组合的j个位标记为1,类似地,根据S的其它字符元P2、P3、P4… 所属的组对W进行标记,完成全部字符元标记后的W,记录有S的字符元信息,称为字 符串S的1标记位值;
用具有n个均为1的位(bit)的数据来标记构成字符串的字符元信息,以其中j个位 为一个组合,则共有个位的组合,相应地分全部字符元为组,以一个位 的组合对应一组字符元,进行标记;如果字符串S的一个字符元P1属于第r组,则将的 构成第r个位的组合的j个位标记为0,类似地,根据S的其它字符元P2、P3、P4…所 属的组对进行标记,完成全部字符元标记后的记录有S的字符元信息,称为字符 串S的0标记位值;
记字符串Sa的1标记位值为Wa,记Sa的0标记位值为记字符串Sb的1标记 位值为Wb,记Sb的0标记位值采用下面方法用于字符串比较:
I.以Wa与Wb进行比较,如果所有Wa为1的位,Wb相应的位也为1,则Sb包含或 可能包含Sa的所有字符元;
II.以与进行比较,如果所有为1的位,相应的位也为1,则Sb包含或 可能包含Sa的所有字符元;
III.以Wa与进行比较,如果与Wa所有相应的位,不同时为1,则Sb包含或可 能包含Sa的所有字符元;
IV.以与Wb进行比较,如果与Wb所有相应的位,不同时为0,则Sb包含或可 能包含Sa的所有字符元。
2.按照权利要求1所述的方法,其特征在于:对Wa、与Wb、进行比较用位 运算符实现:记WT为所有位为1的位值,则方法I能够用Wa→Wb=WT、Wa|Wb=Wb、 Wa&Wb=Wa来实现。
3.按照权利要求1所述的方法,其特征在于:对Wa、与Wb、进行比较,若不 符合判断标准,则Sb不包含Sa的所有字符元;若符合判断标准,当对每一组字符元采用单 个位进行标记且每一组字符元中只有一个字符元时,则Sb包含Sa的所有字符元,不能肯定 Sb是否包含Sa;若符合判断标准,当对每一组字符元采用单个位进行标记而每一组字符元 中有多个字符元时,或者当对每一组字符元采用多个位进行标记时,则Sb可能包含Sa的所有 字符元,不能肯定Sb是否包含Sa;根据需要,再用字符逐位比较方法判断Sb是否包含Sa。
4.按照权利要求1所述的方法,其特征在于:字符元包括汉字偏旁、笔画;汉语拼 音的字母、声母、韵母、音节;其它语言的字母、音节、单词;其它语言的音标;或者它 们的结合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于徐文新,未经徐文新许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200510057491.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:音圈式对焦马达
- 下一篇:便携电话装置以及用于其的呼叫接收历史生成方法