[发明专利]基于成分句法压缩树的指代消解方法有效

专利信息
申请号: 201910212932.5 申请日: 2019-03-20
公开(公告)号: CN109960803B 公开(公告)日: 2023-04-18
发明(设计)人: 孔芳;付建;周国栋 申请(专利权)人: 苏州大学
主分类号: G06F40/211 分类号: G06F40/211;G06F40/295
代理公司: 苏州市中南伟业知识产权代理事务所(普通合伙) 32257 代理人: 杨慧林
地址: 215000 *** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种基于成分句法压缩树的指代消解方法。本发明基于成分句法压缩树的指代消解方法,包括:(1)定义“压缩”操作;(2)针对成分句法树的压缩算法;(3)从成分句法压缩树上提取特征应用于指代消解任务。本发明的有益效果:减小了原始成分句法树的复杂结构,消除了对于指代消解任务无关的冗余结点的信息,为指代消解任务提供了简洁而精确的结构信息,增强了结构信息与层次关系在神经指代消解系统中的表达。
搜索关键词: 基于 成分 句法 压缩 指代 消解 方法
【主权项】:
1.一种基于成分句法压缩树的指代消解方法,其特征在于,包括:(1)定义“压缩”操作:给定成分句法树T的某一结点nt,其孩子结点列表记为nt.children=[n′1,n′2,...,n′m],若其双亲结点不为空,记其双亲结点为parent,其孩子结点列表为parent.children=[...,nt‑1,nt,nt+1,...],对结点nt进行压缩操作:①从结点nt中移除所有其孩子结点并保留;②从nt的双亲结点中移除该结点;③将所有孩子结点插入到原nt在双亲结点中的对应位置;最终,得到parent.children=[...,nt‑1,n′1,n′2,...,n′m,nt+1,...];(2)针对成分句法树的压缩算法:输入:原始成分句法树T,记起根结点为root输出:成分句法压缩树T′①对树T进行后序遍历,得到后序遍历的结点序列nodes;②如果nodes不为空,弹出序列头部结点node,否则转到⑥;③如果node为叶子结点,无需对其进行操作,转到②,否则继续执行;④如果node存在双亲结点,且:(1)如果node只有一个孩子结点,则对结点node执行压缩操作;(2)如果结点node不是名词短语(即标签不为NP)结点,认为其蕴含的结构信息对消解任务的完成没有帮助,故同样对结点node执行压缩操作;其他情况返回②;⑤如果node不存在双亲结点(即为根结点root),且只有一个孩子结点,则对该孩子结点执行压缩操作;否则返回②;⑥返回成分句法压缩树,程序结束;通过上述算法可以得到成分句法压缩树;(3)从成分句法压缩树中抽取出“深度”与“左右兄弟数”特征加入指代消解模型。其中“深度”与“左右兄弟数”的定义如下:结点x的深度:从树T的根结点到结点x的一条简单路径的长度即为x在T中的深度;因此根结点的深度为0;结点x的左右兄弟数:如果两个结点拥有相同的双亲,则称它们为兄弟;由于成分句法树是有序树,定义结点x的左右兄弟数为:[x左侧(或之前)兄弟的数目,x左右(或之后)兄弟的数目];两者的取值范围均为自然数。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州大学,未经苏州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201910212932.5/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top