[发明专利]一种针对词汇序列数据的综合位置编码方法有效
申请号: | 202011297709.4 | 申请日: | 2020-11-18 |
公开(公告)号: | CN112464651B | 公开(公告)日: | 2023-06-23 |
发明(设计)人: | 柳林青;徐小龙 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06F40/242 | 分类号: | G06F40/242;G06F40/284;G06F40/58;G06N3/0455;G06N3/047;G06N3/048;G06N3/08 |
代理公司: | 南京纵横知识产权代理有限公司 32224 | 代理人: | 母秋松 |
地址: | 210003 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 针对 词汇 序列 数据 综合 位置 编码 方法 | ||
1.一种针对词汇序列数据的综合位置编码方法,其特征在于:包括如下步骤:
通过在实数空间随机采样生成三组词典:源输入和目标输入的词汇编码词典源输入和目标输入的绝对位置编码词典源输入和目标输入的相对位置编码键位词典和相对位置编码值位词典其中,lsrc和ltgt分别表示源输入词汇编码词典和目标输入词汇编码词典的大小,下标src、tgt分别代表源输入、目标输入,下标src:K、tgt:K分别代表源输入键位、目标输入键位,下标src:V、tgt:V分别代表源输入值位、目标输入值位,dim为每个特征向量的长度,max_len表示数据中源输入和目标输入中出现过的最长的序列长度,k表示任意两个词汇计算相对位置时允许的最大距离;
根据输入中的词汇查找到词汇编码词典VOCsrc、VOCtgt中对应的特征向量xi、yi,组成源输入和目标输入词汇特征向量组:
Xlen(src)×dim=[x1,x2…xlen(src)-1,end]
Ylen(tgt)×dim=[start,y1…ylen(tgt)-1]
len(src)-1和len(tgt)-1分别表示源输入和目标输入的长度,end和start分别表示语句的结束和开始向量;
在绝对位置词典VOC_POsrc、VOC_POtgt中分别截取前len(src)和len(tgt)行,生成源输入和目标输入绝对位置特征向量组:
将以上数据输入Transformer模型进行训练,得到训练好的Transformer模型;
所述将以上数据输入Transformer模型进行训练,得到训练好的Transformer模型,具体包括如下步骤:
S3-1:对Transformer模型N层编码器进行训练,其中,第i层编码器一端的输入如下:
其中,Wi1Q,Wi1K,Wi1V是编码器中的参数矩阵,bi1Q,bi1K,bi1V是编码器中的参数向量,Xi-1为第i-1层的编码器的输出;
第i层编码器另一端输出如下:
其中,Wi2,Wi3为参数矩阵,bi2,bi3为参数向量;Xi为第i层的编码器的输出;
当i=0时:
X0=X+POsrc
其中,X为源输入词汇特征向量组,POsrc为源输入绝对位置特征向量组,X0第1层编码器一端的输入;
S3-2:对Transformer模型N层解码器进行训练,其中,第i层解码器一端的输入如下:
其中,Wi1Q,Wi1K,Wi1V是解码器中的参数矩阵,bi1Q,bi1K,bi1V是解码器中的参数向量,Yi-1为第i-1层的解码器的输出;
第i层解码器另一端的输出如下:
其中,XN代表第N层编码器的输出,Wi1Q:context,Wi1K:context,Wi1V:context为参数矩阵,bi1Q:context,bi1K:context,bi1V:context为参数向量;
当i=0时:
Y0=Y+POtgt
其中,Yi为第i层的解码器的输出,Y为目标输入词汇特征向量组,POtgt为目标输入绝对位置特征向量组,Y0第1层解码器一端的输入,YN为第N层解码器的输出,为Transformer模型的输出、Wend、bend分别代表参数矩阵、参数向量;
S3-3:设其中,每个v代表一个目标输入词汇的特征向量,根据Y中每个词汇的编号生成一个答案矩阵:
则整个Transformer模型此轮训练的误差为:
ΔOlen(tgt)×dim=Y-(O*A×VOCtgt)
其中,O为
S3-4:准备新的训练样例X和Y,重复执行过程S3-1~S3-3,直到训练轮次满足设定阈值时,得到训练好的Transformer模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011297709.4/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置