[发明专利]一种点击率预估方法、装置、设备及可读存储介质在审
申请号: | 202111249674.1 | 申请日: | 2021-10-26 |
公开(公告)号: | CN114155016A | 公开(公告)日: | 2022-03-08 |
发明(设计)人: | 杨斌;赵辉;徐健;刘哲文 | 申请(专利权)人: | 度小满科技(北京)有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06K9/62;G06N3/04 |
代理公司: | 北京知帆远景知识产权代理有限公司 11890 | 代理人: | 刘岩磊 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 点击率 预估 方法 装置 设备 可读 存储 介质 | ||
本发明公开了一种点击率预估方法,该方法考虑到线性部分只能获取到二阶交叉特征,调用预估模型获取了数据的线性特征、深度特征和高阶交叉特征,通过获取邻接特征相关信息的优势获取更高阶的特征交叉,并同时将线性特征、深度特征和高阶交叉特征相结合用于最终的分类决策。相较过去只利用单一特征或没有应用高阶交叉特征的模型,该方法中供识别的特征种类更多、更丰富,模型泛化能力更强,且得到的高阶交叉特征对于复杂特征的表达能力更强,可以有效提升模型预估精度。本发明还公开了一种点击率预估装置、设备及可读存储介质,具有相应的技术效果。
技术领域
本发明涉及信息处理技术领域,特别是涉及一种点击率预估方法、装置、设备及可读存储介质。
背景技术
经过互联网多年的普及和发展,广告、链接、图片、文章等互联网可点击项以多种形式存在于各种各样的互联网产品中,成为互联网的重要组成部分。
精准互联网营销的核心是点击率预估技术。点击率越高,表明用户对可点击项越感兴趣,进而转化为交易的可能性也越大。因此通过模型算法对点击率进行预测,可以用于指导当前广告、链接、图片、文章等互联网可点击项的精准投放,实现经济效益产出的最大化。
伴随大数据、人工智能等技术的发展,使得投放商利用平台历史数据进行精准营销从技术上成为可能。目前,点击率预估主流技术主要包括两种:单一深度学习模型方法以及混合深度学习模型方法。单一深度学习模型方法常用经典的DNN(深度神经网络)方法进行点击率预估,该类模型则是利用深度学习对数据具有很好的表征能力,但是单一的线性模型泛化能力较差,导致模型精度不高。混合模型的方法主要以DeepFM(宽深模型)方法为代表,结合了传统机器学习方法和深度学习方法的优点,但是实际检测精准度仍然有限,难以达到精准预测的要求。
综上所述,如何提高点击率预估的精准度,是目前本领域技术人员急需解决的技术问题。
发明内容
本发明的目的是提供一种点击率预估方法、装置、设备及可读存储介质,以提高点击率预估的精准度。
为解决上述技术问题,本发明提供如下技术方案:
一种点击率预估方法,包括:
获取可点击项的属性信息;其中,所述属性信息包括:用户信息、对象信息以及场景信息中至少一种;
对所述属性信息进行数据预处理,得到预处理数据;
将所述预处理数据输入至预训练的预测模型中,调用所述预测模型提取所述预处理数据的线性特征、深度特征以及高阶交叉特征后进行点击行为预测分类,生成预测点击概率。
可选地,所述调用所述预测模型提取所述预处理数据的线性特征、深度特征以及高阶交叉特征后进行点击行为预测分类,包括:
所述预测模型对所述预处理数据进行低维映射,得到嵌入特征向量;
分别提取所述嵌入特征向量的线性特征量、深度特征量以及高阶交叉特征量;
对所述线性特征量、所述深度特征量以及所述高阶交叉特征量进行特征拼接,得到多维特征值;
根据所述多维特征值进行点击行为预测分类,生成预测点击概率。
可选地,所述分别提取所述嵌入特征向量的线性特征量、深度特征量以及高阶交叉特征量,包括:
调用卷积网络对所述嵌入特征向量进行特征提取,将提取得到的卷积特征作为所述高阶交叉特征。
可选地,所述调用卷积网络对所述嵌入特征向量进行特征提取,包括:
对所述嵌入特征向量进行数据结构适配处理,生成嵌入特征矩阵;
调用卷积层对所述嵌入特征矩阵进行卷积计算,得到卷积矩阵;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于度小满科技(北京)有限公司,未经度小满科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111249674.1/2.html,转载请声明来源钻瓜专利网。