[发明专利]中文字串的词汇切分系统及其方法有效

专利信息
申请号: 200910132699.6 申请日: 2009-04-07
公开(公告)号: CN101859294A 公开(公告)日: 2010-10-13
发明(设计)人: 邱全成;陈领 申请(专利权)人: 英业达股份有限公司
主分类号: G06F17/27 分类号: G06F17/27;G06F17/30
代理公司: 北京市浩天知识产权代理事务所 11276 代理人: 许志勇
地址: 中国台*** 国省代码: 中国台湾;71
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种中文字串的词汇切分系统及其方法,在确认词汇库有自中文字串撷取的组合词汇时,通过撷取其与下一字作为组合累加词汇并继续查找,反之则撷取该组合词汇的尾字与其下一字进行查找的技术手段,可以解决现有技术在切分中文字串的过程中所存在的产生大量无效切分字词的问题,借此可于兼顾切分速度与字句原意之下,达到降低系统负担的技术功效。
搜索关键词: 中文 字串 词汇 切分 系统 及其 方法
【主权项】:
一种中文字串之词汇切分系统,其特征在于,包含:一词汇库,包含有复数个词汇;一撷取模块,用于自一中文字串撷取其第一字至第二字为第一组合词汇后,依据该第一组合词汇其后续查找之有无,选择撷取该第一组合词汇与其下一字为第一组合累加词汇,或是撷取该第一组合词汇的尾字与其下一字为第二组合词汇;及一查找模块,用于在该词汇库依序进行该第一组合词汇的匹配查找,以及该第一组合累加词汇或该第二组合词汇的匹配查找;其中,当该查找模块确认该词汇库有该第一组合累加词汇时,撷取模块选择撷取该第一组合累加词汇与其下一字为次第一组合累加词汇,反之,则撷取该第一组合累加词汇的尾字与其下一字为该第二组合词汇,由该查找模块进行该次第一组合累加词汇或该第二组合累加词汇的匹配查找,依此类推至任一组合词汇或组合累加词汇包含有该中文字串的最终字为止。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英业达股份有限公司,未经英业达股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/200910132699.6/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top