[发明专利]一种基于自生成全局特征和注意力的图像美学预测方法在审
申请号: | 202010125300.8 | 申请日: | 2020-02-27 |
公开(公告)号: | CN111369124A | 公开(公告)日: | 2020-07-03 |
发明(设计)人: | 徐亦飞;张诺;李晓;徐武将;尉萍萍;朱利 | 申请(专利权)人: | 西安交通大学 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06K9/62;G06N3/08 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 李晓晓 |
地址: | 710049 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 生成 全局 特征 注意力 图像 美学 预测 方法 | ||
1.一种基于自生成全局特征和注意力的图像美学预测方法,其特征在于,包括以下步骤:
步骤1)、对深度分类网络中的自生成全局特征和注意力机制模块进行优化训练,最小化输入得分分布和预测得分分布的差异,得到预测得分分布和真实得分输入分布的相似度;
步骤2)、采用训练后的深度分类网络进行图像的特征提取,对于提取的图像特征进行图像美学评价参数,基于图像美学评价参数进行图像美学的评分。
2.根据权利要求1所述的一种基于自生成全局特征和注意力的图像美学预测方法,其特征在于,深度分类网络采用基于深度卷积的分类网络,以RGB图像及其多个得分数值作为分类网络的输入,分类网络的输出为图像的美学预测得分分布。
3.根据权利要求1所述的一种基于自生成全局特征和注意力的图像美学预测方法,其特征在于,自生成全局特征用于分析深度分类网络的网络结构,通过跳转连接和压缩连接融合局部特征和全局特征,在提取局部特征的同时保存全局特征。
4.根据权利要求3所述的一种基于自生成全局特征和注意力的图像美学预测方法,其特征在于,注意力机制模块考虑图像通道信息和图像空间信息,表示图像包含的与分类任务相关的目标信息,自生成全局特征和注意力机制模块嵌入在深度卷积分类的任意相连的特征图之间。
5.根据权利要求1所述的一种基于自生成全局特征和注意力的图像美学预测方法,其特征在于,深度分类网络采用RGB图像及RGB图像多个得分数值进行训练,最小化输入得分分布和预测得分分布的差异,得到预测得分分布和真实得分输入分布的相似度。
6.根据权利要求5所述的一种基于自生成全局特征和注意力的图像美学预测方法,其特征在于,深度分类网络的训练具体包括以下步骤:
步骤1、采集输入图片并将其划分为训练集Ttrain和测试集Ttest;
步骤2、随机初始化面向分类的网络S(·)中的权重参数、学习率和批大小;
步骤3、将输入图像Ttrain中的图像X输入到深度分类网络S(·),使用adam优化方法训练分类网络的目标函数,当训练的回合次数大于最大回合次数E时,训练停止,完成模型S(·)的训练;
步骤4、将测试集Ttest通过步骤3)保存的训练模型S(·)得到得分分布向量Pi,并通过平均得分公式计算得分Di。
7.根据权利要求6所述的一种基于自生成全局特征和注意力的图像美学预测方法,其特征在于,深度分类网络优化目标为最小化如式(2)所示的损失函数:
L=αLs+βLemd (1)
其中α和β为权重参数,且满足α+β=1,Ls和Lemd分别为softmax交叉熵损失函数和基于EMD损失函数,EMD通过式(3)得到:
其中CDFp(k)和分别为P和的累加分布,k为类别索引,r=2。
8.根据权利要求7所述的一种基于自生成全局特征和注意力的图像美学预测方法,其特征在于,深度分类网络优化训练时采用带有Adam加速器的随机梯度下降方法对目标函数进行优化,其中动量为0.9,权重衰减为10-4,初始化学习率为2.5×10-3,最大迭代数E=100。
9.根据权利要求1所述的一种基于自生成全局特征和注意力的图像美学预测方法,其特征在于,注意力机制模块应用模型在特征图运用的结果为:
其中为矩阵的点乘运算,U'和U”分别为通道注意力机制模块和空间注意力机制模块运用到特征图上的结果。
10.根据权利要求1所述的一种基于自生成全局特征和注意力的图像美学预测方法,其特征在于,自生成全局特征的生成:针对大小为M×M×N的分类器特征图,首先将其缩小为M/2×M/2×N,再将其收缩为M/4×M/4×N,对于收缩层M/4×M/4×N,使用SELU激活函数和两个全连接层和SELU激活函数收缩成大小为1×1×N的特征图,然后,将大小为1×1×N的特征图复制成大小为M×M×N的特征图,并与最初大小为的M×M×N特征图相连接形成大小为M×M×2N的特征图,最终,将大小为M×M×2N的特征图收缩为M×M×N。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010125300.8/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理