[发明专利]神经网络训练方法、装置、计算机设备和存储介质有效

申请号：	201811032787.4	申请日：	2018-09-05
公开（公告）号：	CN109146064B	公开（公告）日：	2023-07-25
发明（设计）人：	涂兆鹏;李建;杨宝嵩;张潼	申请（专利权）人：	腾讯科技（深圳）有限公司
主分类号：	G06N3/045	分类号：	G06N3/045;G06N3/082;G06F18/213;G06F18/214;G06F18/22;G06N3/063
代理公司：	华进联合专利商标代理有限公司 44224	代理人：	何平;邓云鹏
地址：	518000 广东省深圳***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：	本申请涉及一种神经网络训练方法、装置、计算机可读存储介质和计算机设备，该方法包括：获取训练样本集，训练样本集中的各个训练样本存在对应的标准标签；将训练样本集中的训练样本输入神经网络模型中，神经网络模型包括多个注意力网络，多个注意力网络分别将训练样本映射到多个不同的子空间，各个子空间包括对应的请求向量序列、键向量序列和值向量序列；神经网络模型计算各个子空间之间的空间差异度；根据神经网络模型的输出和各个训练样本对应的标准标签计算输出相似度；根据空间差异度和输出相似度对神经网络模型的模型参数进行调整，直至满足收敛条件，得到目标神经网络模型。本申请提供的方案能够提高神经网络模型的输出结果的准确性。
搜索关键词：	神经网络训练方法装置计算机设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种神经网络训练方法，包括：获取训练样本集，所述训练样本集中的各个训练样本存在对应的标准标签；将所述训练样本集中的训练样本输入神经网络模型中，所述神经网络模型包括多个注意力网络，所述多个注意力网络分别将所述训练样本映射到多个不同的子空间，各个子空间包括对应的请求向量序列、键向量序列和值向量序列；所述神经网络模型计算各个所述子空间之间的空间差异度；根据所述神经网络模型的输出和所述各个训练样本对应的标准标签计算输出相似度；根据所述空间差异度和所述输出相似度对所述神经网络模型的模型参数进行调整，直至满足收敛条件，得到目标神经网络模型。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于腾讯科技（深圳）有限公司，未经腾讯科技（深圳）有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201811032787.4/，转载请声明来源钻瓜专利网。

上一篇：一种基于重要点分割的多分段短期负荷预测方法
下一篇：二维数据的卷积运算方法及装置

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06N 基于特定计算模型的计算机系统
G06N3-00 基于生物学模型的计算机系统
G06N3-02 .采用神经网络模型
G06N3-12 .采用遗传模型
G06N3-04 ..体系结构，例如，互连拓扑
G06N3-06 ..物理实现，即神经网络、神经元或神经元部分的硬件实现
G06N3-08 ..学习方法

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]神经网络训练方法、装置、计算机设备和存储介质有效

专利文献下载