[发明专利]神经网络的生成方法和装置在审
申请号: | 202210591391.3 | 申请日: | 2022-05-27 |
公开(公告)号: | CN114912585A | 公开(公告)日: | 2022-08-16 |
发明(设计)人: | 沈力;陶大程 | 申请(专利权)人: | 京东科技信息技术有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;H04L67/55 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
地址: | 100176 北京市大兴区经济*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 神经网络 生成 方法 装置 | ||
1.一种神经网络的生成方法,包括:
获取待训练的神经网络,其中,所述神经网络包括特征提取网络、筛选网络和输出网络,所述特征提取网络用于提取样本特征,以及根据样本特征生成概率向量,筛选网络用于对输入的概率向量进行重参数处理,以及对重参数处理结果应用基于最优传输的Top-K算法,所述输出网络用于根据所述筛选网络的输出生成处理结果;
获取训练数据集,其中,所述训练数据集中的训练数据包括待处理样本和所述待处理样本对应的标签数据,所述待处理样本的类型包括以下至少一项:文本、图像、音频以及视频;
将所述训练数据集中的所述待处理样本作为所述神经网络的输入,将输入的所述待处理样本对应的标签数据作为所述神经网络的期望输出,利用反向传播算法训练所述神经网络,以得到训练完成的神经网络。
2.根据权利要求1所述的方法,其中,所述筛选网络利用Gumbel Trick对所述概率向量进行重参数处理。
3.根据权利要求1所述的方法,其中,所述筛选网络利用Sinkhorn算法实现基于最优传输的Top-K算法。
4.根据权利要求1-3之一所述的方法,其中,所述概率向量中的各元素分别与预设信息集中的信息对应;以及
所述输出网络生成的处理结果用于指示从所述预设信息集中选取的信息。
5.一种信息推送方法,包括:
获取候选推送信息集;
利用预先生成的神经网络从所述候选推送信息集中选取信息,其中,所述神经网络利用权利要求4所示的方法训练得到;
对从所述候选推送信息集中选取的信息进行推送。
6.一种神经网络的生成装置,包括:
第一获取单元,被配置成获取待训练的神经网络,其中,所述神经网络包括特征提取网络、筛选网络和输出网络,所述特征提取网络用于提取样本特征,以及根据样本特征生成概率向量,筛选网络用于对输入的概率向量进行重参数处理,以及对重参数处理结果应用基于最优传输的Top-K算法,所述输出网络用于根据所述筛选网络的输出生成处理结果;
第二获取单元,被配置成获取训练数据集,其中,所述训练数据集中的训练数据包括待处理样本和所述待处理样本对应的标签数据,所述待处理样本的类型包括以下至少一项:文本、图像、音频以及视频;
训练单元,被配置成将所述训练数据集中的所述待处理样本作为所述神经网络的输入,将输入的所述待处理样本对应的标签数据作为所述神经网络的期望输出,利用反向传播算法训练所述神经网络,以得到训练完成的神经网络。
7.根据权利要求6所述的装置,其中,所述筛选网络利用Gumbel Trick对所述概率向量进行重参数处理。
8.根据权利要求6所述的装置,其中,所述筛选网络利用Sinkhorn算法实现基于最优传输的Top-K算法。
9.根据权利要求6-8之一所述的装置,其中,所述概率向量中的各元素分别与预设信息集中的信息对应;以及
所述输出网络生成的处理结果用于指示从所述预设信息集中选取的信息。
10.一种信息推送装置,包括:
第三获取单元,被配置成获取候选推送信息集;
选取单元,被配置成利用预先训练的神经网络从所述候选推送信息集中选取信息,其中,所述神经网络利用权利要求4所示的方法训练得到;
推送单元,被配置成对从所述候选推送信息集中选取的信息进行推送。
11.一种电子设备,包括:
一个或多个处理器;
存储装置,其上存储有一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-5中任一所述的方法。
12.一种计算机可读介质,其上存储有计算机程序,其中,该程序被处理器执行时实现如权利要求1-5中任一所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京东科技信息技术有限公司,未经京东科技信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210591391.3/1.html,转载请声明来源钻瓜专利网。