[发明专利]一种多特征融合的句子级译文质量估计方法有效
申请号: | 201910914342.7 | 申请日: | 2019-09-26 |
公开(公告)号: | CN110688861B | 公开(公告)日: | 2022-12-27 |
发明(设计)人: | 叶娜;王远远;蔡东风 | 申请(专利权)人: | 沈阳航空航天大学 |
主分类号: | G06F40/51 | 分类号: | G06F40/51;G06F40/58;G06F40/211;G06N3/04;G06N3/08 |
代理公司: | 沈阳优普达知识产权代理事务所(特殊普通合伙) 21234 | 代理人: | 李晓光 |
地址: | 110136 辽宁*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 特征 融合 句子 译文 质量 估计 方法 | ||
1.一种多特征融合的句子级译文质量估计方法,其特征在于包括以下步骤:
1)并行提取词预测特征、语境化词嵌入特征、依存句法特征以及基线特征;
2)上述特征提取后,分别对各特征进行进一步整合,针对特征向量采用将各特征由Bi-LSTM层编码后的最后一个隐状态直接相加的方式和将各个向量按指定维度拼接的方式进行融合;
3)通过上述两种融合方式得到两种高维向量,分别将两种方式所得到的特征融合向量与基线特征Ho进行拼接,作为最终的特征融合向量,利用sigmoid函数进行最终的HTER值即译文质量分数预测;
步骤1)中,提取语境化词嵌入特征为:
采用基于上下文的语言表示模型BERT作为特征提取器,其使用双向transformer作为编码器,编码器中的self-attention操作将句子中每个词的位置信息进行编码融入,同时引入遮蔽机制利用输入语言的上下文信息,将其用作词嵌入模型以提取源语言和机器译文的语境化的词嵌入特征;
同时对源语言和机器输出译文进行编码,得到双语词嵌入并将其进行拼接作为一种特征;。
步骤1)中提取依存句法特征为:
分别将源语言(x1,x2,...,xn)和机器译文(y1,y2,...,ym)输入到句法分析工具Stanford Parser中;
采用句法分析工具Stanford Parser对输入句子分别进行句法分析后,得到各个词与其中心词之间的依存元组其中xi表示源语言当前词,表示源语言当前词对应的中心词,yi表示机器译文当前词,表示机器译文当前词对应的中心词,relation表示其依存关系;
从依存元组中将中心词提取出来,并将两个句子的中心词信息进行拼接得到依存句法特征序列其中代表源语言每个词所对应的中心词,表示机器译文中的每个词对应的中心词;
2.根据权利要求1所述的多特征融合的句子级译文质量估计方法,其特征在于步骤2)中对各特征进行融合,是将各个特征分别输入到以LSTM为结点的双向循环神经网络中进一步学习后,再整合各个最终得到的隐藏状态作为最终双语信息表征向量,进而用于译文质量估计分数的计算;模型的构建以RNN为基础,采用RNN的变体-长短时记忆网络作为基本的网络单元编码各个特征序列内部之间的联系,具体为:
分别输入提取的双语特征向量序列,经Bi-LSTM编码后,保留最后一个隐状态向量作为输出;
针对特征向量提出两种不同的融合方式,第一种是将各特征由Bi-LSTM层编码后的最后一个隐状态直接相加的方式,将向量空间约束在一定范围内,采用对该向量取均值,即算术平均的策略,该策略默认每一个特征的重要程度都相同,即给每一个特征设置固定权重,公式如下:
H1=(HB+Hs+Hw)/3
其中,H1是采用第一种融合方式得到的融合向量,HB、HS、Hw分别表示语境化词嵌入特征隐状态、依存句法特征隐状态和词预测特征隐状态。
3.根据权利要求1所述的多特征融合的句子级译文质量估计方法,其特征在于步骤2)中,针对特征向量提出两种不同的融合方式,第二种是将各个向量按指定维度拼接的方式,从最终得到的融合后的特征向量分析,该方式未修改各个特征的任何维度内容,使得每一个特征所携带的信息得到充分表达,公式如下:
H2=[HB;Hs;Hw]
其中,H2是采用第二种融合方式得到的融合向量。
4.根据权利要求1所述的多特征融合的句子级译文质量估计方法,其特征在于步骤3)中,拼接方式如下所示:
H=[Hi;Ho](i=1,2)
H表示最终融合向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于沈阳航空航天大学,未经沈阳航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910914342.7/1.html,转载请声明来源钻瓜专利网。