[发明专利]基于成分句法压缩树的指代消解方法有效
申请号: | 201910212932.5 | 申请日: | 2019-03-20 |
公开(公告)号: | CN109960803B | 公开(公告)日: | 2023-04-18 |
发明(设计)人: | 孔芳;付建;周国栋 | 申请(专利权)人: | 苏州大学 |
主分类号: | G06F40/211 | 分类号: | G06F40/211;G06F40/295 |
代理公司: | 苏州市中南伟业知识产权代理事务所(普通合伙) 32257 | 代理人: | 杨慧林 |
地址: | 215000 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于成分句法压缩树的指代消解方法。本发明基于成分句法压缩树的指代消解方法,包括:(1)定义“压缩”操作;(2)针对成分句法树的压缩算法;(3)从成分句法压缩树上提取特征应用于指代消解任务。本发明的有益效果:减小了原始成分句法树的复杂结构,消除了对于指代消解任务无关的冗余结点的信息,为指代消解任务提供了简洁而精确的结构信息,增强了结构信息与层次关系在神经指代消解系统中的表达。 | ||
搜索关键词: | 基于 成分 句法 压缩 指代 消解 方法 | ||
【主权项】:
1.一种基于成分句法压缩树的指代消解方法,其特征在于,包括:(1)定义“压缩”操作:给定成分句法树T的某一结点nt,其孩子结点列表记为nt.children=[n′1,n′2,...,n′m],若其双亲结点不为空,记其双亲结点为parent,其孩子结点列表为parent.children=[...,nt‑1,nt,nt+1,...],对结点nt进行压缩操作:①从结点nt中移除所有其孩子结点并保留;②从nt的双亲结点中移除该结点;③将所有孩子结点插入到原nt在双亲结点中的对应位置;最终,得到parent.children=[...,nt‑1,n′1,n′2,...,n′m,nt+1,...];(2)针对成分句法树的压缩算法:输入:原始成分句法树T,记起根结点为root输出:成分句法压缩树T′①对树T进行后序遍历,得到后序遍历的结点序列nodes;②如果nodes不为空,弹出序列头部结点node,否则转到⑥;③如果node为叶子结点,无需对其进行操作,转到②,否则继续执行;④如果node存在双亲结点,且:(1)如果node只有一个孩子结点,则对结点node执行压缩操作;(2)如果结点node不是名词短语(即标签不为NP)结点,认为其蕴含的结构信息对消解任务的完成没有帮助,故同样对结点node执行压缩操作;其他情况返回②;⑤如果node不存在双亲结点(即为根结点root),且只有一个孩子结点,则对该孩子结点执行压缩操作;否则返回②;⑥返回成分句法压缩树,程序结束;通过上述算法可以得到成分句法压缩树;(3)从成分句法压缩树中抽取出“深度”与“左右兄弟数”特征加入指代消解模型。其中“深度”与“左右兄弟数”的定义如下:结点x的深度:从树T的根结点到结点x的一条简单路径的长度即为x在T中的深度;因此根结点的深度为0;结点x的左右兄弟数:如果两个结点拥有相同的双亲,则称它们为兄弟;由于成分句法树是有序树,定义结点x的左右兄弟数为:[x左侧(或之前)兄弟的数目,x左右(或之后)兄弟的数目];两者的取值范围均为自然数。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州大学,未经苏州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910212932.5/,转载请声明来源钻瓜专利网。