[发明专利]基于非局部神经网络的机器学习模型有效
申请号: | 201880086764.3 | 申请日: | 2018-11-16 |
公开(公告)号: | CN111602147B | 公开(公告)日: | 2023-07-07 |
发明(设计)人: | 何恺明;罗斯·格尔希克;王晓龙 | 申请(专利权)人: | 元平台公司 |
主分类号: | G06N3/082 | 分类号: | G06N3/082;G06F16/903;G06F17/15;G06N3/048;G06N3/0464;G06N3/0442;G06N3/04;G06N3/042 |
代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 俞立文;杨明钊 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 局部 神经网络 机器 学习 模型 | ||
1.一种用于在助理系统中使用的方法,用于通过使用户能够在会话中利用用户输入与所述助理系统交互来帮助用户获得信息或服务,从而获得帮助,其中所述用户输入包括声音、文本、图像或视频或它们的任意组合,所述助理系统通过计算设备、应用编程接口(API)、以及用户设备上应用激增的组合来实现,所述方法包括:
基于包括多个阶段的神经网络来训练基线机器学习模型,其中每个阶段包括多个神经块;
访问分别包括多个内容对象的多个训练样本;
确定一个或更多个非局部操作,其中每个非局部操作基于一个或更多个成对函数和一个或更多个一元函数;
基于所述多个训练样本和所述一个或更多个非局部操作来生成一个或更多个非局部块;
从所述神经网络的所述多个阶段中确定一个阶段;以及
通过将所述一个或更多个非局部块中的每一个插入所述神经网络的所确定的阶段中的多个神经块中的至少两个神经块之间来训练非局部机器学习模型,
其中所述助理系统使用一个或更多个非局部机器学习模型来分析包括语音、文本、图像、视频或它们的组合中的一个或更多个的内容对象。
2.根据权利要求1所述的方法,其中,所述神经网络包括卷积神经网络或循环神经网络中的一个或更多个。
3.根据权利要求1或2所述的方法,其中,所述多个内容对象中的每一个包括文本、音频剪辑、图像或视频中的一个或更多个。
4.根据权利要求1或2所述的方法,其中,所述神经网络基于二维架构或三维架构中的一个或更多个。
5.根据权利要求1或2所述的方法,还包括:
基于所述基线机器学习模型来分别生成关于所述多个内容对象的多个特征表示。
6.根据权利要求5所述的方法,其中,生成所述一个或更多个非局部块中的每一个包括:
将所述一个或更多个非局部操作中的每一个应用于所述多个内容对象之一的特征表示。
7.根据权利要求5所述的方法,还包括:
为所述多个内容对象中的每一个确定输出位置和与该输出位置相关联的多个位置。
8.根据权利要求7所述的方法,其中,所述输出位置在空间、时间或时空中的一个或更多个中。
9.根据权利要求7所述的方法,其中,所述一个或更多个非局部操作中的每一个基于函数并且其中:
xi指示所述输出位置处的特征表示;
xj指示所述多个位置之一处的特征表示;
yi指示所述输出位置处的输出响应;
f(xi,xj)指示所述成对函数;
g(xj)指示所述一元函数;以及
C(x)指示归一化因子。
10.根据权利要求9所述的方法,其中,所述成对函数基于以下一项或更多项:
高斯函数
嵌入高斯函数其中θ是xi的嵌入,并且φ是xj的嵌入;
点积函数f(xi,xj)=θ(xi)Tφ(xj);或者
级联函数其中ReLU指示整流线性单元的函数,并且其中wf是将θ(xi)和φ(xj)的级联向量投影到标量的权重向量。
11.根据权利要求5所述的方法,还包括:
通过对所述多个内容对象中的每个内容对象的特征表示应用子采样,来为所述内容对象生成子采样的内容对象,其中所述子采样的内容对象与子采样的特征表示相关联。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于元平台公司,未经元平台公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201880086764.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:充气轮胎
- 下一篇:信息处理装置、信息处理方法和记录介质