[发明专利]一种深度特征提取的广告点击率预测系统及其预测方法有效
申请号: | 201610983314.7 | 申请日: | 2016-11-08 |
公开(公告)号: | CN106529721B | 公开(公告)日: | 2018-12-25 |
发明(设计)人: | 许荣斌;谢莹;张磊;张兴义;张以文 | 申请(专利权)人: | 安徽大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q10/04;G06Q30/02 |
代理公司: | 合肥市浩智运专利代理事务所(普通合伙) 34124 | 代理人: | 方荣肖 |
地址: | 230001 *** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种深度特征提取的广告点击率预测系统及其预测方法。所述系统包括:广告日志数据采集子系统,其用于采集广告点击日志数据;分区检测子系统,其用于对所述广告点击日志数据进行分区检测;十层稀疏约束特征提取隐层子系统,其用于在经过分区检测后的广告点击日志数据中提取广告数据的深度特征;空间约束模型生成子系统,其用于根据所述深度特征进行空间约束得到预测模型。其中,当有新的广告点击日志数据输入时,所述预测模型就能得到对应的预测结果。本发明能提取广告点击日志数据中的深度特征,针对大量广告点击日志数据先进行分区模块检测,加强稀疏规划,融合空间约束进而生成预测模型。 | ||
搜索关键词: | 一种 深度 特征 提取 广告 点击率 预测 系统 及其 方法 | ||
【主权项】:
1.一种深度特征提取的广告点击率预测系统,其特征在于:其包括:广告日志数据采集子系统,其用于采集广告点击日志数据;分区检测子系统,其用于对所述广告点击日志数据进行分区检测;十层稀疏约束特征提取隐层子系统,引入十层稀疏堆栈自编码器,用于在经过分区检测后的广告点击日志数据中提取广告数据的深度特征;空间约束模型生成子系统,其用于根据所述深度特征进行空间约束得到预测模型;其中,当有新的广告点击日志数据输入时,所述预测模型就能得到对应的预测结果;所述分区检测子系统将所述广告点击日志数据建模为无向无权图G,G=(V,E),其中,V={V1,V2,…VN}是N个数据节点的集合;E=[eij]是V中两个数据节点i和j连接边的集合;分区检测子系统目的在于针对所述广告点击日志数据分析进而找到K个模块
所述分区检测子系统引入索引矩阵
hik代表数据节点i属于模块K的概率,
表示概率值为N*N的正实数矩阵;所述分区检测子系统捕获数据节点i属于模块K的概率,索引矩阵H的每一行表示为属于同一个模块K内数据节点的分布;并设计wij为连接数据节点i和j的概率,这个概率被认为是由数据节点i和j生成的边属于同一个社区的概率,数据节点i和j的连接概率是:
邻接矩阵W表示为内含非负元素的对称矩阵
若数据节点i和j之间有边则wij=1,否则wij=0;对于所有1≤i≤N,wii=0;所述分区检测子系统将分区检测问题看作非负元素的对称矩阵的分解问题,令
通过分区检测方法来寻找索引矩阵H以重建邻接矩阵W,获得数据的K个模块;采用基于W和HHT两个矩阵之间的L1范式来衡量W和HHT之间的损失;索引矩阵H的第i行表示节点i所属的模块,借助辅助矩阵Z,得到:
采用方程(1)在低维空间中寻找新的最具代表力的信息并重建邻接矩阵;在分区检测子系统中建立分区模块最大化模块函数S,S定义为在分区内部边的数量和在所有成对的数据节点期望数值之间的差值,最大化模块函数S设计为:
其中,h为H的列向量数据,Q为模块化矩阵;采用hTh=N来简化,当方程(2)扩展到模块数K>2时,获得:S=LKL(H,Q)=Tr(HQHT) (3);其中,Tr(.)是矩阵的迹;基于Rayleigh商,方程(3)的结果是模块化矩阵Q的最大特征向量。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽大学,未经安徽大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610983314.7/,转载请声明来源钻瓜专利网。