[发明专利]一种基于注意力机制的图像美学质量评价方法有效
申请号: | 201910553271.2 | 申请日: | 2019-06-25 |
公开(公告)号: | CN110473164B | 公开(公告)日: | 2021-10-15 |
发明(设计)人: | 宋丹丹;杨知水 | 申请(专利权)人: | 北京理工大学 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06N3/04;G06N3/08 |
代理公司: | 北京正阳理工知识产权代理事务所(普通合伙) 11639 | 代理人: | 毛燕 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于注意力机制的图像美学质量评价方法,属于计算机视觉技术领域;首先处理训练数据,然后设计网络结构模型,采用轻量级深度网络作为主干网络,融入注意力机制模块;之后,基于数据均衡思想,设计用于训练网络的损失函数;最后用处理好的训练数据训练网络结构模型,得到一个具有自动评价图像美学质量的网络模型;并基于该模型对输入图片进行美学评分以及将该模型应用于拍摄以辅助用户实时拍出更加美观的图片。对比现有技术,本发明采用的网络结构模型能更加有效的提取图像的特征,采用的损失函数,极大增强了模型对数据的学习能力,相比于其他方法既提高了准确率,又减少了模型的参数量。 | ||
搜索关键词: | 一种 基于 注意力 机制 图像 美学 质量 评价 方法 | ||
【主权项】:
1.一种基于注意力机制的图像美学质量评价方法,其特征在于,包括以下步骤:/n步骤1:设计网络结构模型;/n网络结构模型为:主干网络用n层深度可分离卷积层(Depthwise Separableconvolutions),主干网络中任意位置插入注意力模块,主干网络后接全局均值池化层(GlobalAverage Pooling)、全连接层以及softmax层;注意力模块用于模拟人的视觉机制,对于图像中的重点区域赋予较大的权重;/n步骤2:设计用于训练网络的损失函数;/n采用下述基于数据均衡的bEMD损失作为损失函数:/n /n其中,p为真实值得分的概率分布, 为预测值得分的概率分布;Si为第i张图片的评分人数, 为整个数据集中图片的平均评分人数, N为数据集中图片的总数;CDFp(k)是真实得分累积分布函数 表示图片第j个真实分值的概率,k表示分值的总数; 是预测得分累积分布函数 表示图片第j个预测分值的概率;除去 权重部分,该公式为CDFp(k)和 的闵可夫斯基距离(Minkowski Distance)定义,r=1为曼哈顿距离、r=2为欧氏距离、r→∞时为切比雪夫距离;/n步骤3:处理训练数据;/n将训练数据处理成满足网络结构模型要求的大小;/n步骤4:用步骤3中处理好的训练数据、步骤2的损失函数,训练步骤1的网络结构模型得到图像美学质量评价网络;/n步骤5:输入图片进行美学评分;/n将待评价的图片缩放至所述网络结构模型要求的大小,输入所述图像美学质量评价网络中,得到该图片的每一个评分的概率分布,通过下述公式计算该分布的均值得到图片的美学得分μ:/n /n其中,bi为第i个分值, 表示第i个分值的概率,K表示分值的总数。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910553271.2/,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序