[发明专利]一种改进嵌入层的广告点击率预测模型训练方法在审
申请号: | 202111627057.0 | 申请日: | 2021-12-28 |
公开(公告)号: | CN114282669A | 公开(公告)日: | 2022-04-05 |
发明(设计)人: | 沈学利;韩倩雯 | 申请(专利权)人: | 辽宁工程技术大学 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/04;G06K9/62 |
代理公司: | 北京华夏正合知识产权代理事务所(普通合伙) 11017 | 代理人: | 韩登营 |
地址: | 123000 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 改进 嵌入 广告 点击率 预测 模型 训练 方法 | ||
1.一种改进嵌入层的广告点击率预测模型训练方法,其特征在于,包括如下步骤:
S1:获取预处理后的数据集,其中,每个样本数据包含离散化特征和连续特征,对于特征处理部分只考虑分类特征的情况,通过对连续性特征进行离散化分类来进行数据预处理信息;
S2:通过改进的嵌入层有效的将高维稀疏的数据映射为低维特征数据,其中,改进的嵌入层是普通嵌入层与自注意力模块相结合,更好的学习特征内部联系并赋予权重过滤无用信息;
S3:一方面通过逻辑回归对低阶显性特征进行处理,丰富对低阶显性特征表达的缺失,另一方面将低维特征数据输入到特征提取网络,提取二阶特征组合信息;
S4:将低阶部分训练结果与高阶训练结果通过函数归一化得到最终预测值。
2.根据权利要求1所述的改进嵌入层的广告点击率预测模型训练方法,其特征在于,自注意力机制的计算是在特征提取前相对于自身之间的内部联系进行训练,突出有效信息并加快训练速度,将特征向量输出的通过与权重矩阵相乘得到对应的张量,即查询张量Q、键张量K和值张量V,通过公式计算得出对应的赋予权重之后的矩阵,公式如下:
3.根据权利要求2所述的改进嵌入层的广告点击率预测模型训练方法,其特征在于,通过分别对相应特征进行复制和内积操作,用o(p,i,j)表示第i个特征的复制操作,用表示第i个特征和第j个特征的内积操作;
输出嵌入特征ef和交互特征if,假设有个m特征可以构造如下:
γ是从操作到索引的映射,if可以按如下方式构建:
if=[p1,2,p1,3,...,pm-1,m]
其中pi,j是第i个特征和第j个特征之间的内积运算的值:
连接嵌入特征ef和交互特征if构成了该层的输出:
f=[ef,if]
多层感知机用于提取高阶特征和预测,首先对f进行批量归一化,其结果表示为:
fdnn=BN(f)
其中贝叶斯是指批处理规范化,用来加速训练提高预测精确度,对于MLP的每一层添加批处理规范化,并使用校正后的线性单位relu,最后使用sigmoid函数完成概率预测的任务。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于辽宁工程技术大学,未经辽宁工程技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111627057.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:磁环电感自动检测包装工艺及设备
- 下一篇:一种基于动物医学养育用智能保温箱