[发明专利]语言形态分析器无效
申请号: | 200510135590.X | 申请日: | 2005-12-30 |
公开(公告)号: | CN1991819A | 公开(公告)日: | 2007-07-04 |
发明(设计)人: | 毛新年;李珩;董远 | 申请(专利权)人: | 北京法国电信研发中心有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 北京市柳沈律师事务所 | 代理人: | 窦杰平 |
地址: | 100080北京市海淀区科*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种自然语言形态分析器和一种通过计算机根据形态词构词语法从文本中识别和提取所述语言的形态词(MDW)的方法,所述方法包括以下步骤:加载形态词构词语法的计算机可读规则;输入文本,并且按照该语言的标点符号来从输入文本获得句子;形成每个句子的词格,所述词格包括至少一个元素,每个元素对应于句子中一个字或一个可能的词;通过使用与所加载的形态词构词语法规则相结合的表解析算法来解析每个句子的词格以从词格的一个或多个元素中获得MDW候选词;以及输出所获得的MDW候选词。本发明可以有效且高效地从文本识别和提取MDW,并且迅速获得MDW的句法、语义和形态模式信息。 | ||
搜索关键词: | 语言 形态 分析器 | ||
【主权项】:
1.一种通过计算机根据预定义的形态词构词语法从文本识别和提取所述语言的形态词(MDW)的方法,所述方法包括步骤:加载形态词构词语法的计算机可读规则;输入文本,并且按照所述语言的标点符号来从输入文本中获得句子;形成每个句子的词格,所述词格包括至少一个元素,每个元素对应于句中一个字或一个可能的词;通过使用与所加载的形态词构词语法规则相结合的表解析算法来解析每个句子的词格以从词格的一个或多个元素中获得MDW候选词;以及输出所获得的MDW候选词。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京法国电信研发中心有限公司,未经北京法国电信研发中心有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200510135590.X/,转载请声明来源钻瓜专利网。