[发明专利]一种基于多任务深度网络的多源大数据分析方法有效

申请号：	201711353319.2	申请日：	2017-12-15
公开（公告）号：	CN107977456B	公开（公告）日：	2018-10-30
发明（设计）人：	龙明盛;王建民;陈新阳;黄向东	申请（专利权）人：	清华大学
主分类号：	G06F17/30	分类号：	G06F17/30;G06N3/08
代理公司：	北京路浩知识产权代理有限公司 11002	代理人：	王莹;吴欢燕
地址：	100084 北京市海***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明实施例提供了一种基于多任务深度网络的多源大数据分析方法及系统，所述方法包括：将待分析多源大数据输入训练好的多任务深度网络，得到所述待分析多源大数据的多个任务的分析结果；其中，所述训练好的多任务深度网络分类层的前一层具有与所述多个任务一一对应的多个网络参数，用于根据所述分类层前一层的输入特征得到所述分类层中每个分类器的输入特征。在训练得到用于多源大数据分析的多任务深度网络的过程中，将分类层的前一层设为不共享网络参数的特定任务相关层，更好的挖掘了不同任务之间的联系；利用张量正态分布作为先验概率来挖掘特定任务相关层网络参数之间的关系；使得训练后的多任务深度网络对多源大数据的分析更加快速准确。
搜索关键词：	一种基于任务深度网络多源大数据分析方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于多任务深度网络的多源大数据分析方法，其特征在于，所述方法包括：将待分析多源大数据输入至训练好的多任务深度网络，输出所述待分析多源大数据的多个任务的分析结果；其中，所述训练好的多任务深度网络的分类层的前一层具有多个网络参数，且所述多个网络参数与所述多个任务一一对应，所述分类层的前一层用于根据所述多个网络参数和所述分类层前一层的输入特征，得到所述分类层中每个分类器的输入特征；其中，在所述将待分析多源大数据输入至训练好的多任务深度网络之前，所述方法还包括：获取所述待分析多源大数据对应的训练数据集，并利用所述训练数据集自底向上对所述多任务深度网络的每层网络进行训练，得到每层网络的参数，再利用反向传播算法对每层网络的网络参数进行更新；重复上述训练过程直至预设损失函数的值处于预设范围，得到所述训练好的多任务深度网络；所述预设损失函数为特定任务相关层的网络参数的最大后验估计与所述多任务深度网络的经验损失之和，其中所述特定任务相关层的网络参数的最大后验估计通过以张量正态分布为先验概率对特定任务相关层的网络参数进行最大后验估计得到，所述特定任务相关层包括所述分类层和所述分类层的前一层；所述多任务深度网络的经验损失为：其中，J为交叉熵损失函数，为第t个任务的样本，为第t个任务的标签，N_t为第t个任务的样本数，为将转换为的条件概率；其中，J是交叉熵损失函数，即：J(x，y)＝‑y ln(x)‑(1‑y)ln(1‑x)。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于清华大学，未经清华大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201711353319.2/，转载请声明来源钻瓜专利网。

上一篇：ceb文件全文搜索方法、装置以及计算机可读存储介质
下一篇：数据清算方法、系统和计算机可读存储介质

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F17-00 特别适用于特定功能的数字计算设备或数据处理设备或数据处理方法
G06F17-10 .复杂数学运算的
G06F17-20 .处理自然语言数据的
G06F17-30 .信息检索；及其数据库结构
G06F17-40 .数据的获取和记录
G06F17-50 .计算机辅助设计

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于多任务深度网络的多源大数据分析方法有效

专利文献下载