[发明专利]一种融合多句法结构的语义关系分类方法有效
申请号: | 201810614041.8 | 申请日: | 2018-06-14 |
公开(公告)号: | CN108875000B | 公开(公告)日: | 2021-12-28 |
发明(设计)人: | 郝志峰;陈培辉;蔡瑞初;温雯;王丽娟;陈炳丰 | 申请(专利权)人: | 广东工业大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/30;G06F40/211;G06K9/62 |
代理公司: | 广州市红荔专利代理有限公司 44214 | 代理人: | 吴伟文 |
地址: | 510006 *** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 融合 句法 结构 语义 关系 分类 方法 | ||
1.一种融合多句法结构的语义关系分类方法,其特征在于,包括以下步骤:
S1、对文本序列进行数据预处理,获取该文本序列S={S1,S2,...,Sn}的词性标签P={P1,P2,...,Pn}和依赖关系标签D={D1,D2,...,Dn};
S2、对文本序列S={S1,S2,...,Sn}以及词性标签P={P1,P2,...,Pn}进行双向编码h={h1,h2}与加权学习获得加权后的双向编码h'={h'1,h'2},并对加权后的双向编码h'={h'1,h'2}进行解码获得该文本序列S={S1,S2,...,Sn}的实体标签L={L1,L2,...,Ln};
S3、利用依赖关系标签D={D1,D2,...,Dn}、双向编码h={h1,h2}以及实体标签L={L1,L2,...,Ln}构建联合向量V={D,h,L},并利用联合向量V={D,h,L}对双向树结构网络进行端到端的训练,获取文本序列S={S1,S2,...,Sn}的三元组结构化信息并进行非线性变换后输出语义关系类别;
步骤S2具体为:
S21、对文本序列S={S1,S2,...,Sn}以及词性标签P={P1,P2,...,Pn}进行拼接,得到文本词性拼接向量V={Sn,Pn};
S22、将文本词性拼接向量V={Sn,Pn}输入到双向循环神经网络Bi-LSTM中,获取两个方向的隐状态向量h1和h2;
S23、对隐状态向量h1和h2进行拼接获得双向编码h={h1,h2};
S24、利用注意力机制对双向编码h={h1,h2}进行加权学习并获得加权后的双向编码h'={h'1,h'2};
S25、对加权后的双向编码h'={h'1,h'2}进行解码获得该文本序列S={S1,S2,...,Sn}的实体标签L={L1,L2,...,Ln};所述步骤S24具体为:将双向编码h={h1,h2}输入到基于word-level的Attention机制模型中进行加权学习,获得加权后的双向编码h'={h'1,h'2}。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810614041.8/1.html,转载请声明来源钻瓜专利网。