首页在售求购查询申请展会资讯专利榜企服商城升级VIP

立即登录免费注册

在售专利
求购专利
查询专利
新闻资讯
技术展会
招商加盟
专利榜

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

[发明专利]一种基于transformer多种注意力机制的权重分配方法在审

申请号：	201910924914.X	申请日：	2019-09-27
公开（公告）号：	CN110688860A	公开（公告）日：	2020-01-14
发明（设计）人：	闫明明;陈绪浩;罗华成;赵宇;段世豪	申请（专利权）人：	电子科技大学
主分类号：	G06F40/47	分类号：	G06F40/47;G06F40/45
代理公司：	51126 成都中亚专利代理有限公司	代理人：	王岗
地址：	611731 四川省成***	国省代码：	四川;51
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	注意力机制输出注意力模型目标语言对齐正则化计算过程权重分配权重函数实验效果随机参数词向量源语言最优性运算逼近偏离翻译保存
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于transformer多种注意力机制的权重分配方法，应用基于注意力机制的transformer模型中，其特征在于；包括如下步骤：

步骤1：在transformer模型中，针对应用情景选取其中较优秀的模型输出。

步骤2：初始化权重序列δ的值，第一次计算时权重序列δ为随机数，并且δ₁+δ₂+....+δ_i＝1；

步骤3：将各模型输出进行正则化计算并计算出各输出的中心点(与所有值最接近的点)，通过计算公式fin_out＝δ₁O₁+δ₂O₂+δ₃O₃.......+δ_iO_i计算出最优的匹配值作为最终输出；其中δ₁+δ₂+....+δ_i＝1且δ_i是我们设置的权重参数；O_i是各种注意力模型的输出；

步骤4：将最终输出代入后续运算中，计算与上一次训练相比损失函数的差值，若损失函数下降，则提高δ中靠中心点的序列比重；若损失函数上升，则提升δ序列中与中心点最远的序列比重，整个过程严格遵守δ₁+δ₂+....+δ_i＝1的规则；

步骤5：多次循环迭代计算，最终确定最佳权重序列δ。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于电子科技大学，未经电子科技大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201910924914.X/1.html，转载请声明来源钻瓜专利网。

上一篇：基于机器学习的语义解析方法、装置、介质及电子设备
下一篇：一种多特征融合的句子级译文质量估计方法

同类专利

专利分类

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

友情链接：交换友情链接需要网站权重大于4，网站收录10W以上，如符合条件，请联系QQ：。

关于我们寻求报道投稿须知广告合作版权声明网站地图友情链接企业标识联系我们

在线咨询

周一至周五 9:00-18:00

版权所有http://www.vipzhuanli.com/公布日期

咨询在线客服

咨询在线客服

tel code back_top