[发明专利]一种基于历史信息的自然语言层次句法分析方法无效
申请号: | 200810243604.3 | 申请日: | 2008-12-10 |
公开(公告)号: | CN101446941A | 公开(公告)日: | 2009-06-03 |
发明(设计)人: | 朱巧明;周国栋;李培峰;李军辉;钱龙华;孔芳;王红玲;钱培德 | 申请(专利权)人: | 苏州大学 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 苏州创元专利商标事务所有限公司 | 代理人: | 陶海锋 |
地址: | 215123江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 历史 信息 自然语言 层次 句法 分析 方法 | ||
1.一种基于历史信息的自然语言层次句法分析方法,其特征在于:对已完成分词的句子,首先将各个词看成是初始组块,采用分层方式,根据上下文信息进行组块识别,将可以组合的组块构成新的组块,获得中间结果,对中间结果重复根据上下文信息进行组块识别及组合,直至只包含一个组块为止,该组块为句法树的根结点,由此获得表达自然语言的句法树。
2.根据权利要求1所述的自然语言层次句法分析方法,其特征在于:所述组块识别及组合的方法是,采用BIESO标记方法,对某一组块类别X,B-X表示开始新的组块X,I-X表示合并至前一组块,E-X表示结束前一组块,S-X表示单独构成组块X,O表示保持不变,根据句法分析的特征模板结合上下文特征,通过训练过程和分析过程,采用分类器实现组块的识别和组合。
3.根据权利要求2所述的自然语言层次句法分析方法,其特征在于:所述句法分析的特征模板包括:
cons(n):第n棵树的中心词、成分标记以及决策标记的联合信息,当n≥0时,决策标记省略;
cons(n*):第n棵树的中心词的词性、成分标记以及决策标记的联合信息,当n≥0时,决策标记省略;
cons(n**):第n棵树的成分标记以及决策标记的联合信息,当n≥0时,决策标记省略;
所述上下文特征包括下列5类:
第1类:cons(n),cons(n*),cons(n**),其中-2≤n≤3共18个;
第2类:cons(m,n),cons(m*,n),cons(m,n*),cons(m*,n*),cons(m**,n),cons(m**,n*),cons(m*,n**),cons(m,n**),cons(m**,n**),其中(m,n)=(-1,0)or(0,1)共18个;
第3类:cons(0,m,n),cons(0,m*,n*),cons(0,m*,n),cons(0,m,n*),cons(0*,m*,n*),(m,n)=(1,2),(-2,-1)or(-1,1),and cons(1,2,3),cons(1*,2*,3*),cons(1**,2**,3**),cons(2*,3*,4*),cons(2**,3**,4**)共20个;
第4类:cons(0,1,2,3),cons(0,1*,2*,3*),cons(0*,1*,2*,3*),cons(1*,2*,3*,4*),cons(1**,2**,3**,4**)共5个;
第5类:cons(0*,1*,2*,3*,4*),cons(0**,1**,2**,3**,4**)共2个。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州大学,未经苏州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810243604.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:多功能标识和标识带
- 下一篇:一种智能PLC串口通讯模块
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置