[发明专利]基于关键字的字符序列分割方法及装置有效
申请号: | 201110265973.4 | 申请日: | 2011-09-08 |
公开(公告)号: | CN102819524A | 公开(公告)日: | 2012-12-12 |
发明(设计)人: | 阳荣 | 申请(专利权)人: | 金蝶软件(中国)有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 胡海国 |
地址: | 518057 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 关键字 字符 序列 分割 方法 装置 | ||
1.一种基于关键字的字符序列分割方法,其特征在于,包括以下步骤:
加载关键字,并建立关键字列表;
根据所述关键字列表中关键字属性的优先级对所述关键字进行排序;
依据排序结果,以所述关键字为最小分割单位,通过预定的分词算法对字符序列进行分割。
2.根据权利要求1所述的方法,其特征在于,所述依据排序结果,以所述关键字为最小分割单位,通过预定的分词算法对字符序列进行分割的步骤包括:
将字符序列作为整段压入栈中;
根据排序优先级从关键字列表中取出关键字;
获取所述关键字在所述字符序列中的位置索引号;
根据所述位置索引号对所述字符序列进行分割。
3.根据权利要求2所述的方法,其特征在于,所述根据位置索引号对所述字符序列进行分割的步骤包括:
当所述位置索引号等于第一预定值时,将所述关键字作为分段压入所述临时栈中;
若所述关键字后面还存在内容,则将所述关键字后面的内容作为分段压入所述临时栈中;
将所述临时栈中的各分段内容依次压入所述栈中;
从所述关键字列表中取出下一级关键字,并根据所述下一级关键字分别对所述栈中的各分段进行分割,直至所述关键字列表被取空。
4.根据权利要求3所述的方法,其特征在于,所述将关键字作为分段压入所述临时栈中的步骤之前还包括:
当所述位置索引号大于第一预定值时,将所述整段中位于所述关键字前面的内容作为分段压入临时栈中。
5.根据权利要求3所述的方法,其特征在于,所述将临时栈中的各分段内容依次压入所述栈中的步骤之前还包括:
当所述位置索引号等于第二预定值时,将所述整段压入所述临时栈中。
6.根据权利要求1-5中任一项所述的方法,其特征在于,所述关键字包括自定义关键字及预定义关键字。
7.一种基于关键字的字符序列分割装置,其特征在于,包括:
关键字列表建立模块,用于加载关键字,并建立关键字列表;
关键字排序模块,用于根据所述关键字列表中关键字属性的优先级对所述关键字进行排序;
字符序列分割模块,用于依据排序结果,以所述关键字为最小分割单位,通过预定的分词算法对字符序列进行分割。
8.根据权利要求7所述的装置,其特征在于,所述字符序列分割模块包括:
整段压入单元,用于将字符序列作为整段压入栈中;
取出单元,用于根据排序优先级从关键字列表中取出关键字;
获取单元,用于获取所述关键字在所述字符序列中的位置索引号;
分割压入单元,用于根据所述位置索引号对所述字符序列进行分割。
9.根据权利要求8所述的装置,其特征在于,所述分割压入单元还用于当所述位置索引号等于第一预定值时,将所述关键字作为分段压入所述临时栈中;当所述位置索引号大于第一预定值时,将所述整段中位于所述关键字前面的内容作为分段压入临时栈中,同时将所述关键字作为分段压入所述临时栈中;若所述关键字后面还存在内容,则将所述关键字后面的内容作为分段压入所述临时栈中;将所述临时栈中的各分段内容依次压入所述栈中;从所述关键字列表中取出下一级关键字,并根据所述下一级关键字分别对所述栈中的各分段进行分割,直至所述关键字列表被取空。
10.根据权利要求9所述的装置,其特征在于,所述分割压入单元还用于:当所述位置索引号等于第二预定值时,将所述整段压入所述临时栈中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于金蝶软件(中国)有限公司,未经金蝶软件(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110265973.4/1.html,转载请声明来源钻瓜专利网。