[发明专利]基于美学特征的海报CTR预测方法及装置有效
申请号: | 202110100658.X | 申请日: | 2021-01-25 |
公开(公告)号: | CN112767038B | 公开(公告)日: | 2021-08-27 |
发明(设计)人: | 范凌 | 申请(专利权)人: | 特赞(上海)信息科技有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06K9/46;G06K9/62;G06N3/08 |
代理公司: | 北京知果之信知识产权代理有限公司 11541 | 代理人: | 卜荣丽 |
地址: | 201203 上海市浦东新区中国(上海)*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 美学 特征 海报 ctr 预测 方法 装置 | ||
1.一种基于美学特征的海报CTR预测方法,其特征在于,所述方法包括:
对预设数量的海报图像分别进行多维度的特征提取,得到每张海报图像对应的多种美学特征;
分别对每张图像的多种美学特征中的类别型特征进行one-hot处理;
对于每张海报图像,将与其对应的one-hot处理后的特征与其他的美学特征进行横向合并,得到每张海报图像对应的美学特征向量,其中,其他的美学特征是指除类别型之外的特征;
在将与其对应的one-hot处理后的特征与其他的美学特征进行横向合并之前,计算每种美学特征每种特征的方差值;移除方差值小于预设阈值的特征;
将所有的美学特征向量与每张海报对应的点击通过率对三种监督学习模型进行训练,得到三种点击通过率预测模型,所述三种监督学习模型为决策树模型、随机森林模型、支持向量机SVM模型;
根据三种点击通过率预测模型的预测结果和真实值之间的均根方差,选择其中一个预测模型确定为最终的点击通过率模型,包括:
将所有的美学特征向量与每张海报对应的点击通过率对三种监督学习模型进行训练,得到三种点击通过率预测模型的初始模型;
分别对每种初始模型的模型参数进行多次调节,观察预测结果和真实值之间的均根方差,将使预测结果和真实值之间的均根方差最小的模型参数组合作为对应的三种点击通过率预测模型的最终参数组合;
不同的模型对应的调节参数是不同的,若监督学习模型为决策树模型,则调节树的深度、叶节点所需的最小样本数;若监督学习模型为随机森林模型,则调节树的数量、每棵树选择的样本数量、树的最大深度;若监督学习模型为支持向量机SVM模型,则调节惩罚系数、gamma参数;
预测结果和真实值是针对每张用于模型训练的海报图像的通过模型得到的点击通过率和真实获取到的点击功通过率;在进行每种模型的预测结果和真实值之间的均根方差计算时,包括:用所有或部分的用于训练的海报图像;将预设数据的海报图像进行分类,一部分用于模型训练,一部分用于模型的调参;
根据每种最终参数组合确定三种点击通过率模型;
将待预测海报图像对应的美学特征向量输入到最终的点击通过率模型,得到待预测海报图像的点击通过率预测结果;
其中,对预设数量的海报图像分别进行多维度的特征提取,得到每张海报图像对应的多种美学特征,包括:
从:基础特征、元素特征、人物特征、颜色特征、文字特征、显著性特征、风格特征、Logo特征8个维度去提取美学特征;
基础特征包括:图片色调、图片饱和度、图片明度、图片色值熵、图片色偏、图片的RGB色值、对比度、色温;
元素特征包括:装饰元素的数量、装饰元素面积占比、装饰元素中心点坐标、主商品元素数量、主商品元素的面积占比、主商品元素的中心点坐标、文本元素数量、文本元素的面积占比、文本元素的中心点坐标、文本元素和商品元素面积重叠占比;
人物特征包括:模特平均年龄、模特表情类型、模特颜值;
颜色特征包括:各颜色的占比,颜色包括:灰色、蓝色、青色、黄色、绿色、紫色、白色、红色、品红、橘黄;
文字特征包括:文字行数、文字中心点坐标、文字字数、主文案、主文案字数;
显著性特征是通过显著性模型得出的图片像素级别的显著性分数,其特征包括:显著性均值、显著性标准差;
风格特征是通过风格检测模型得出的各个风格程度的分数,其特征包括:干净程度、可爱程度、黑暗程度、时尚程度、极简程度、现代程度、流行程度、水彩程度;
Logo特征包括:Logo数量、Logo面积占比、Logo坐标、Logo名称。
2.根据权利要求1中所述的基于美学特征的海报CTR预测方法,其特征在于,根据三种点击通过率预测模型的预测结果和真实值之间的均根方差,选择其中一个预测模型确定为最终的点击通过率模型,包括:
分别计算三种点击通过率预测模型的预测结果和真实值之间的均根方差;
将均根方差最小的点击通过率模型作为最终的点击通过率模型。
3.根据权利要求1中所述的基于美学特征的海报CTR预测方法,其特征在于,所述方法还包括:
根据待预测海报图像对应的美学特征向量和最终的点击通过率模型,判断每一种特征对海报图像的点击通过的影响度;
根据每种特征对应的影响度对所述预测海报图像进行调整。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于特赞(上海)信息科技有限公司,未经特赞(上海)信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110100658.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种智慧社区用的户外监控装置
- 下一篇:半导体装置