[发明专利]一种基于历史信息的自然语言层次句法分析方法无效

专利信息
申请号: 200810243604.3 申请日: 2008-12-10
公开(公告)号: CN101446941A 公开(公告)日: 2009-06-03
发明(设计)人: 朱巧明;周国栋;李培峰;李军辉;钱龙华;孔芳;王红玲;钱培德 申请(专利权)人: 苏州大学
主分类号: G06F17/27 分类号: G06F17/27
代理公司: 苏州创元专利商标事务所有限公司 代理人: 陶海锋
地址: 215123江苏省*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 历史 信息 自然语言 层次 句法 分析 方法
【权利要求书】:

1.一种基于历史信息的自然语言层次句法分析方法,其特征在于:对已完成分词的句子,首先将各个词看成是初始组块,采用分层方式,根据上下文信息进行组块识别,将可以组合的组块构成新的组块,获得中间结果,对中间结果重复根据上下文信息进行组块识别及组合,直至只包含一个组块为止,该组块为句法树的根结点,由此获得表达自然语言的句法树。

2.根据权利要求1所述的自然语言层次句法分析方法,其特征在于:所述组块识别及组合的方法是,采用BIESO标记方法,对某一组块类别X,B-X表示开始新的组块X,I-X表示合并至前一组块,E-X表示结束前一组块,S-X表示单独构成组块X,O表示保持不变,根据句法分析的特征模板结合上下文特征,通过训练过程和分析过程,采用分类器实现组块的识别和组合。

3.根据权利要求2所述的自然语言层次句法分析方法,其特征在于:所述句法分析的特征模板包括:

cons(n):第n棵树的中心词、成分标记以及决策标记的联合信息,当n≥0时,决策标记省略;

cons(n):第n棵树的中心词的词性、成分标记以及决策标记的联合信息,当n≥0时,决策标记省略;

cons(n**):第n棵树的成分标记以及决策标记的联合信息,当n≥0时,决策标记省略;

所述上下文特征包括下列5类:

第1类:cons(n),cons(n),cons(n**),其中-2≤n≤3共18个;

第2类:cons(m,n),cons(m,n),cons(m,n),cons(m,n),cons(m**,n),cons(m**,n),cons(m,n**),cons(m,n**),cons(m**,n**),其中(m,n)=(-1,0)or(0,1)共18个;

第3类:cons(0,m,n),cons(0,m,n),cons(0,m,n),cons(0,m,n),cons(0,m,n),(m,n)=(1,2),(-2,-1)or(-1,1),and cons(1,2,3),cons(1,2,3),cons(1**,2**,3**),cons(2,3,4),cons(2**,3**,4**)共20个;

第4类:cons(0,1,2,3),cons(0,1,2,3),cons(0,1,2,3),cons(1,2,3,4),cons(1**,2**,3**,4**)共5个;

第5类:cons(0,1,2,3,4),cons(0**,1**,2**,3**,4**)共2个。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州大学,未经苏州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200810243604.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top