[发明专利]一种点击率预估方法、装置、设备及可读存储介质在审
申请号: | 202111249674.1 | 申请日: | 2021-10-26 |
公开(公告)号: | CN114155016A | 公开(公告)日: | 2022-03-08 |
发明(设计)人: | 杨斌;赵辉;徐健;刘哲文 | 申请(专利权)人: | 度小满科技(北京)有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06K9/62;G06N3/04 |
代理公司: | 北京知帆远景知识产权代理有限公司 11890 | 代理人: | 刘岩磊 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 点击率 预估 方法 装置 设备 可读 存储 介质 | ||
1.一种点击率预估方法,其特征在于,包括:
获取可点击项的属性信息;其中,所述属性信息包括:用户信息、对象信息以及场景信息中至少一种;
对所述属性信息进行数据预处理,得到预处理数据;
将所述预处理数据输入至预训练的预测模型中,调用所述预测模型提取所述预处理数据的线性特征、深度特征以及高阶交叉特征后进行点击行为预测分类,生成预测点击概率。
2.根据权利要求1所述的点击率预估方法,其特征在于,所述调用所述预测模型提取所述预处理数据的线性特征、深度特征以及高阶交叉特征后进行点击行为预测分类,包括:
所述预测模型对所述预处理数据进行低维映射,得到嵌入特征向量;
分别提取所述嵌入特征向量的线性特征量、深度特征量以及高阶交叉特征量;
对所述线性特征量、所述深度特征量以及所述高阶交叉特征量进行特征拼接,得到多维特征值;
根据所述多维特征值进行点击行为预测分类,生成预测点击概率。
3.根据权利要求2所述的点击率预估方法,其特征在于,所述分别提取所述嵌入特征向量的线性特征量、深度特征量以及高阶交叉特征量,包括:
调用卷积网络对所述嵌入特征向量进行特征提取,将提取得到的卷积特征作为所述高阶交叉特征。
4.根据权利要求3所述的点击率预估方法,其特征在于,所述调用卷积网络对所述嵌入特征向量进行特征提取,包括:
对所述嵌入特征向量进行数据结构适配处理,生成嵌入特征矩阵;
调用卷积层对所述嵌入特征矩阵进行卷积计算,得到卷积矩阵;
调用池化层对所述卷积矩阵进行池化处理,得到特征结果矩阵;
将各所述特征结果矩阵进行归一化数据拼接处理,得到特征结果值;
将所述特征结果值作为所述卷积特征。
5.根据权利要求1所述的点击率预估方法,其特征在于,所述对所述属性信息进行数据预处理,包括:
对所述属性信息中各信息项进行缺失值填充,得到填充信息;
对所述填充信息进行数字化编码处理,得到数字信息;
对所述数字信息进行归一化处理,得到归一化信息;
将所述归一化信息作为所述预处理数据。
6.根据权利要求5所述的点击率预估方法,其特征在于,在所述对所述属性信息中各信息项进行缺失值填充之前,还包括:
计算所述属性信息中各信息项的数据缺失率;
判断所述数据缺失率是否超过比例阈值;
若否,执行所述对所述属性信息中各信息项进行缺失值填充;
若是,从所述属性信息中删除所述信息项。
7.根据权利要求1所述的点击率预估方法,其特征在于,在所述生成点击概率之后,还包括:
获取模型的中间特征;
按照特征处理顺序对所述中间特征以及所述点击概率进行可视化输出处理。
8.一种点击率预估装置,其特征在于,包括:
信息获取单元,用于获取可点击项的属性信息;其中,所述属性信息包括:用户信息、对象信息以及场景信息中至少一种;
预处理单元,用于对所述属性信息进行数据预处理,得到预处理数据;
模型识别单元,用于将所述预处理数据输入至预训练的预测模型中,调用所述预测模型提取所述预处理数据的线性特征、深度特征以及高阶交叉特征后进行点击行为预测分类,生成预测点击概率。
9.一种计算机设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至7任一项所述点击率预估方法的步骤。
10.一种可读存储介质,其特征在于,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述点击率预估方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于度小满科技(北京)有限公司,未经度小满科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111249674.1/1.html,转载请声明来源钻瓜专利网。