[发明专利]一种基于计算机的自然语言句法结构解析方法和装置有效
申请号: | 201410172114.4 | 申请日: | 2014-04-25 |
公开(公告)号: | CN103927298A | 公开(公告)日: | 2014-07-16 |
发明(设计)人: | 秦一男 | 申请(专利权)人: | 秦一男 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 北京成创同维知识产权代理有限公司 11449 | 代理人: | 刘锋;张靖琳 |
地址: | 100871 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于计算机的自然语言句法结构解析方法和装置。本发明依据抽象代数、集合论、组合数学和计算语言学等学科的数学原理和相应的计算机技术,运用复合函数的数学思想,通过建立矩阵模型和线性模型来进行自然语言句法结构解析。所述方法较易于实现,且可以大幅度提高复合式句子结构解析的准确性。 | ||
搜索关键词: | 一种 基于 计算机 自然语言 句法 结构 解析 方法 装置 | ||
【主权项】:
一种基于计算机的自然语言句法结构解析方法,包括:读取待解析的经预处理的语句数据结构,所述经预处理的语句数据结构中仅包括语句的关联词单元、谓语动词单元、名词代词单元,且各词单元按照在所述经预处理的语句中的顺序进行编号,并标注类型;对每一谓语动词单元,生成对应的引导语元素、主语元素、谓语元素和宾语元素;所述引导语元素的可能取值为编号小于对应的谓语动词单元编号的关联词单元之一,或空单元;所述主语元素的可能取值为编号小于对应的谓语动词单元编号的名词代词单元之一或空单元,或在前出现的谓语动词单元对应的句法向量之一;所述谓语元素为对应的所述谓语动词单元;所述宾语元素的可能取值为编号大于对应的谓语动词单元编号且小于相邻的在后出现的谓语动词单元编号的名词代词单元之一,或在后出现的谓语动词单元对应的句法向量之一;根据所述引导语元素、主语元素、谓语元素和宾语元素的可能取值,获取每一谓语动词单元对应的句法向量的所有可能取值,所述句法向量包括引导语元素、主语元素、谓语元素和宾语元素;根据所有句法向量的所有可能取值,生成至少一个句法结构可能矩阵解,所述句法结构可能矩阵解由按照谓语动词单元编号顺序排列的句法向量组成;验证根据句法结构可能矩阵解得到的语句是否与所述经预处理的语句完全相同,如果完全相同,则将该句法结构可能矩阵解中的各句法向量作为句法结构解析结果之一。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于秦一男,未经秦一男许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410172114.4/,转载请声明来源钻瓜专利网。