[发明专利]中文语句分词方法及其在中文查错系统中的应用无效
申请号: | 97103125.8 | 申请日: | 1997-03-13 |
公开(公告)号: | CN1193779A | 公开(公告)日: | 1998-09-23 |
发明(设计)人: | 裘照明;杨力平 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06F17/20 | 分类号: | G06F17/20 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 | 代理人: | 于静 |
地址: | 美国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明描述了一种能够有效地检测出中文文本中错误的方案。通过把经常出现的错误、人名、地名、组织名、数词或数量与量词的组合,与常规字典中常用词一样,看成是一般的分词单元,并为它们分配合适的权值,把动态规划方法用于中文查错CEC系统,来对语句进行最为合适的分词处理。该方法可以使CEC系统获得最高的错误检出率,而同时又能够使其误报率在类似的系统中保持为最低。 | ||
搜索关键词: | 中文 语句 分词 方法 及其 查错 系统 中的 应用 | ||
【主权项】:
1.一种对中文语句进行分词的方法,其特征在于包括以下步骤:除常规字典中词之外,定义多个分词单元类别;相对常规字典中词的权值,为所述分词单元类别分配合适的权值;以及使用动态规划方法,选择满足一定条件的分词结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/97103125.8/,转载请声明来源钻瓜专利网。
- 上一篇:一种造纸黑液的净化与回收方法
- 下一篇:快速冷却开水机