[发明专利]一种无监督句法控制释义生成系统及方法在审
申请号: | 202310295984.X | 申请日: | 2023-03-24 |
公开(公告)号: | CN116362256A | 公开(公告)日: | 2023-06-30 |
发明(设计)人: | 张小旺;孙悦 | 申请(专利权)人: | 天津大学 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/211;G06N3/0442;G06N3/088 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 韩帅 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 监督 句法 控制 释义 生成 系统 方法 | ||
1.一种无监督句法控制释义生成系统,其特征在于:所述释义生成系统包括数据预处理模块、语义编码器、句法序列化模块、句法编码器、混合注意力模块和Double-GRU解码器;其中:所述预处理模块包括数据集、解析单元;所述混合注意力模块包括单调注意力单元、短语间注意力单元和短语内注意力单元;包括如下步骤:
所述数据集中原始英文侧句子作为输入全局语义信息xi;
所述解析单元分解目标句获得目标选区句法树ti;
所述句法序列化模块将目标选区句法树ti转换为句法三序列(si,pi,pai);其中:表示句法结点序列,其是通过深度优先遍历ti得到;表示结点位置序列,其中是在序列si的绝对位置;表示父结点位置序列,其中是的父结点在序列si的绝对位置;
所述语义编码器对全局语义信息xi进行编码生成语义向量;
所述句法编码器采用选区句法树嵌套结构对句法三序列(si,pi,pai)扩散生成句法上下文嵌入向量;
所述混合注意力模块将句法编码器最后一层得到的句法上下文嵌入向量与Double-GRU解码器上一时刻隐藏层状态ht-1输入混合注意力模块,捕捉与目标单词相关的句法子结构生成目标句法子结构synt;
所述Double-GRU解码器通过两个独立的GRU单元分别对提取的目标句法子结构synt与上一时刻目标单词yt-1迭代解码获得结合目标句法以及语义信息的目标句。
2.根据权利要求1所述的一种无监督句法控制释义生成系统,其特征在于:所述句法编码器生成句法上下文嵌入向量过程,包括如下步骤:
利用结点位置序列pi和父结点位置序列pai得到第一层句法编码器的可视化矩阵a1:
如果结点和结点是兄弟结点或者是父子结点,则两者在第一层句法编码器中是可以相互作用的;
第一层句法编码器将句法结点序列si和结点位置序列pi作为输入:
其中:e(·),pos(·)分别表示单词编码和位置编码,表示第一层句法编码器得到的句法上下文表示;同理,基于a1可以得到第l层句法编码器的可视化矩阵al以及句法上下文表示
如果句法结点和句法结点之间相对距离小于等于l-1,并且句法结点与句法结点之间相对距离为1,则句法结点与结点之间相对距离小于等于l;表示第l-1层句法编码器输出的句法上下文向量表示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310295984.X/1.html,转载请声明来源钻瓜专利网。