[发明专利]一种融合多句法结构的语义关系分类方法有效
申请号: | 201810614041.8 | 申请日: | 2018-06-14 |
公开(公告)号: | CN108875000B | 公开(公告)日: | 2021-12-28 |
发明(设计)人: | 郝志峰;陈培辉;蔡瑞初;温雯;王丽娟;陈炳丰 | 申请(专利权)人: | 广东工业大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/30;G06F40/211;G06K9/62 |
代理公司: | 广州市红荔专利代理有限公司 44214 | 代理人: | 吴伟文 |
地址: | 510006 *** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及自然语言处理技术领域,涉及一种融合多句法结构的语义关系分类方法,包括以下步骤,先对文本序列进行数据预处理;然后对文本序列的向量进行双向编码,利用注意力机制对编码信息进行加权学习,通过CRF对加权后的编码信息进行双向解码,获取文本序列上的实体标签信息;然后构造联合向量,构造融合多句法的复杂网络,利用共享参数进行端到端的训练,获取三元组上的隐状态并进行拼接,经线性变换后输出语义关系类别。本发明基于叠层的循环神经网络模型,将多种句法结构进行融合,解决了单一句法结构模型无法有效适应其他句法结构的问题,从而能有效处理不同的句法结构,提高了模型的鲁邦性,并提升了分类效率。 | ||
搜索关键词: | 一种 融合 句法 结构 语义 关系 分类 方法 | ||
【主权项】:
1.一种融合多句法结构的语义关系分类方法,其特征在于,包括以下步骤:S1、对文本序列进行数据预处理,获取该文本序列S={S1,S2,...,Sn}的词性标签P={P1,P2,...,Pn}和依赖关系标签D={D1,D2,...,Dn};S2、对文本序列S={S1,S2,...,Sn}以及词性标签P={P1,P2,...,Pn}进行双向编码h={h1,h2}与加权学习获得加权后的双向编码h'={h'1,h'2},并对加权后的双向编码h'={h'1,h'2}进行解码获得该文本序列S={S1,S2,...,Sn}的实体标签L={L1,L2,...,Ln};S3、利用依赖关系标签D={D1,D2,...,Dn}、双向编码h={h1,h2}以及实体标签L={L1,L2,...,Ln}构建联合向量V={D,h,L},并利用联合向量V={D,h,L}对双向树结构网络进行端到端的训练,获取文本序列S={S1,S2,...,Sn}的三元组结构化信息并进行非线性变换后输出语义关系类别。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810614041.8/,转载请声明来源钻瓜专利网。