[发明专利]一种针对词汇序列数据的综合位置编码方法有效

专利信息
申请号: 202011297709.4 申请日: 2020-11-18
公开(公告)号: CN112464651B 公开(公告)日: 2023-06-23
发明(设计)人: 柳林青;徐小龙 申请(专利权)人: 南京邮电大学
主分类号: G06F40/242 分类号: G06F40/242;G06F40/284;G06F40/58;G06N3/0455;G06N3/047;G06N3/048;G06N3/08
代理公司: 南京纵横知识产权代理有限公司 32224 代理人: 母秋松
地址: 210003 江苏*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 针对 词汇 序列 数据 综合 位置 编码 方法
【权利要求书】:

1.一种针对词汇序列数据的综合位置编码方法,其特征在于:包括如下步骤:

通过在实数空间随机采样生成三组词典:源输入和目标输入的词汇编码词典源输入和目标输入的绝对位置编码词典源输入和目标输入的相对位置编码键位词典和相对位置编码值位词典其中,lsrc和ltgt分别表示源输入词汇编码词典和目标输入词汇编码词典的大小,下标src、tgt分别代表源输入、目标输入,下标src:K、tgt:K分别代表源输入键位、目标输入键位,下标src:V、tgt:V分别代表源输入值位、目标输入值位,dim为每个特征向量的长度,max_len表示数据中源输入和目标输入中出现过的最长的序列长度,k表示任意两个词汇计算相对位置时允许的最大距离;

根据输入中的词汇查找到词汇编码词典VOCsrc、VOCtgt中对应的特征向量xi、yi,组成源输入和目标输入词汇特征向量组:

Xlen(src)×dim=[x1,x2…xlen(src)-1,end]

Ylen(tgt)×dim=[start,y1…ylen(tgt)-1]

len(src)-1和len(tgt)-1分别表示源输入和目标输入的长度,end和start分别表示语句的结束和开始向量;

在绝对位置词典VOC_POsrc、VOC_POtgt中分别截取前len(src)和len(tgt)行,生成源输入和目标输入绝对位置特征向量组:

将以上数据输入Transformer模型进行训练,得到训练好的Transformer模型;

所述将以上数据输入Transformer模型进行训练,得到训练好的Transformer模型,具体包括如下步骤:

S3-1:对Transformer模型N层编码器进行训练,其中,第i层编码器一端的输入如下:

其中,Wi1Q,Wi1K,Wi1V是编码器中的参数矩阵,bi1Q,bi1K,bi1V是编码器中的参数向量,Xi-1为第i-1层的编码器的输出;

第i层编码器另一端输出如下:

其中,Wi2,Wi3为参数矩阵,bi2,bi3为参数向量;Xi为第i层的编码器的输出;

当i=0时:

X0=X+POsrc

其中,X为源输入词汇特征向量组,POsrc为源输入绝对位置特征向量组,X0第1层编码器一端的输入;

S3-2:对Transformer模型N层解码器进行训练,其中,第i层解码器一端的输入如下:

其中,Wi1Q,Wi1K,Wi1V是解码器中的参数矩阵,bi1Q,bi1K,bi1V是解码器中的参数向量,Yi-1为第i-1层的解码器的输出;

第i层解码器另一端的输出如下:

其中,XN代表第N层编码器的输出,Wi1Q:context,Wi1K:context,Wi1V:context为参数矩阵,bi1Q:context,bi1K:context,bi1V:context为参数向量;

当i=0时:

Y0=Y+POtgt

其中,Yi为第i层的解码器的输出,Y为目标输入词汇特征向量组,POtgt为目标输入绝对位置特征向量组,Y0第1层解码器一端的输入,YN为第N层解码器的输出,为Transformer模型的输出、Wend、bend分别代表参数矩阵、参数向量;

S3-3:设其中,每个v代表一个目标输入词汇的特征向量,根据Y中每个词汇的编号生成一个答案矩阵:

则整个Transformer模型此轮训练的误差为:

ΔOlen(tgt)×dim=Y-(O*A×VOCtgt)

其中,O为

S3-4:准备新的训练样例X和Y,重复执行过程S3-1~S3-3,直到训练轮次满足设定阈值时,得到训练好的Transformer模型。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011297709.4/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top