[发明专利]汉语语句切分的方法及其系统无效
申请号: | 98118413.8 | 申请日: | 1998-08-13 |
公开(公告)号: | CN1086821C | 公开(公告)日: | 2002-06-26 |
发明(设计)人: | 张景嵩;张金玉;郑奕 | 申请(专利权)人: | 英业达股份有限公司 |
主分类号: | G06F17/20 | 分类号: | G06F17/20 |
代理公司: | 中国专利代理(香港)有限公司 | 代理人: | 王勇,陈景峻 |
地址: | 台湾省*** | 国省代码: | 台湾;71 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种汉语语句切分的方法及系统。其先提供一汉语语句的输入,此汉语语句是由多个字符所组成的一文字字串。再根据一词语库,对此文字字串进行词语匹配。接着,判断经匹配后的分词路径是否唯一;若是,则完成该汉语语句切分的方法;若否,则选择该多个分词路径中的最短者。然后,判断该最短分词路径是否唯一;若是,则完成该汉语语句切分的方法;若否,则根据一词语词频库,计算该最短分词路径相对应的词语数量,确定该最短分词路径之中的最佳者。最后,将最佳最短分词路径输出。 | ||
搜索关键词: | 汉语 语句 切分 方法 及其 系统 | ||
【主权项】:
1.一种汉语语句切分方法,包括下列步骤:(a)输入一汉语语句,该汉语语句是由多个字符所组成的一文字字串;(b)根据一词语存储装置,对该文字字串进行词语匹配,采用词语与该语句的语义无关原则;(c)判断经匹配后的分词路径是否唯一;若是,则完成该汉语语句切分过程;否则,(d)选择该分词路径中最短者,采用最少分词优先原则;(e)判断该最短分词路径是否唯一,若是,则完成该汉语语句切分过程;否则(f)根据一词语词频存储装置,选择该最短分词路径可能性最高者,以词频加权数值来决定;以及(g)输出该可能性最高的最短分词路径。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英业达股份有限公司,未经英业达股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/98118413.8/,转载请声明来源钻瓜专利网。
- 上一篇:镍钛形状记忆接骨器
- 下一篇:用于从其传送信息的智能卡和方法