[发明专利]基于深度学习的互联网用户注意力指数计算方法和系统在审
申请号: | 201710804848.3 | 申请日: | 2017-09-08 |
公开(公告)号: | CN107977397A | 公开(公告)日: | 2018-05-01 |
发明(设计)人: | 庄浩;张均贺;蔡恒;张继勇 | 申请(专利权)人: | 华瑞新智科技(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06N3/04 |
代理公司: | 北京理工大学专利中心11120 | 代理人: | 温子云,仇蕾安 |
地址: | 100081 北京市海淀区中关*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 学习 互联网 用户 注意力 指数 计算方法 系统 | ||
1.一种基于深度学习的互联网用户注意力指数计算方法,其特征在于,包括如下步骤:
步骤1、采集并处理多个互联网平台的各种类型数据,提取反映用户注意力的有效信息;
步骤2、将步骤1提取的有效信息写成词分布式表示矩阵;
步骤3、词分布式表示矩阵输入到多层深度网络学习模型的每一层算法模型中;所述多层深度网络学习模型中包括n层算法模型,如果n=1,则多层深度网络学习模型仅包括1层深度算法模型,如果n≥2,多层深度网络学习模型中的1层为深度算法模型,其他层可以为深度算法模型或基本算法模型;根据设定选择1层或1层以上的算法模型参与运算,参与运算的算法模型中必须有1层是深度算法模型;参与运算的每层算法模型均输出重要词及其权重;
步骤4、根据多层深度网络学习模型中每一层算法模型输出的重要词及其权重,计算互联网用户注意力。
2.如权利要求1所述的方法,其特征在于,所述各种类型数据包括搜索引擎数据、社交网络数据、电商数据、点评数据以及第三方公司内部数据。
3.如权利要求1所述的方法,其特征在于,所述步骤4为:先利用每一层算法模型输出的重要词及其权重,计算本层的互联网用户注意力;再将各层学习模型的互联网用户注意力进行综合,得到最终的互联网用户注意力指数值。
4.如权利要求1所述的方法,其特征在于,所述步骤3采用的深度算法模型为:词嵌入模型、卷积层CNN模型或递归序列RNN模型。
5.如权利要求1所述的方法,其特征在于,所述基本算法模型为基于词权重的算法模型、基于话题表示的算法模型或基于实体表示的算法模型。
6.一种基于深度学习的互联网用户注意力指数计算系统,其特征在于,包括大数据处理引擎、词分布式表示模块、多层深度网络学习模块、用户注意力计算模块;
所述大数据处理引擎,用于采集并处理多个互联网平台的各种类型数据,提取反映用户注意力的有效信息;
词分布式表示模块,用于将所述有效信息写成词分布式表示矩阵;
多层深度网络学习模块,用于将所述词分布式表示矩阵输入到多层深度网络学习模型的每一层算法模型中;所述多层深度网络学习模型中包括至少一层采用深度算法模型,其他层采用深度算法模型或基本算法模型;一个算法模型采用一个子模块实现,根据需要选择1个或1个以上的子模块进行组装,以参与运算,且参与运算的算法模型中必须有1层是深度算法模型;每层算法模型均输出重要词及其权重;
用户注意力计算模块,用于根据多层深度网络学习模块输出的重要词及其权重,计算互联网用户注意力。
7.如权利要求6所述的系统,其特征在于,所述大数据处理引擎采集的各种类型数据包括搜索引擎数据、社交网络数据、电商数据、点评数据以及第三方公司内部数据。
8.如权利要求6所述的系统,其特征在于,所述用户注意力计算模块先利用每一层学习模型输出的重要词及其权重,计算本层的互联网用户注意力;再将各层学习模型的互联网用户注意力进行综合评价,得到最终的互联网用户注意力指数值。
9.如权利要求6所述的系统,其特征在于,所述多层深度网络学习模块采用的深度算法模型为:词嵌入模型、卷积层CNN模型或递归序列RNN模型。
10.如权利要求6所述的系统,其特征在于,所述多层深度网络学习模块采用的基本算法模型为基于词权重的算法模型、基于话题表示的算法模型或基于实体表示的算法模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华瑞新智科技(北京)有限公司,未经华瑞新智科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710804848.3/1.html,转载请声明来源钻瓜专利网。