[发明专利]一种基于注意力机制的图像美学质量评价方法有效

专利信息
申请号: 201910553271.2 申请日: 2019-06-25
公开(公告)号: CN110473164B 公开(公告)日: 2021-10-15
发明(设计)人: 宋丹丹;杨知水 申请(专利权)人: 北京理工大学
主分类号: G06T7/00 分类号: G06T7/00;G06N3/04;G06N3/08
代理公司: 北京正阳理工知识产权代理事务所(普通合伙) 11639 代理人: 毛燕
地址: 100081 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明涉及一种基于注意力机制的图像美学质量评价方法,属于计算机视觉技术领域;首先处理训练数据,然后设计网络结构模型,采用轻量级深度网络作为主干网络,融入注意力机制模块;之后,基于数据均衡思想,设计用于训练网络的损失函数;最后用处理好的训练数据训练网络结构模型,得到一个具有自动评价图像美学质量的网络模型;并基于该模型对输入图片进行美学评分以及将该模型应用于拍摄以辅助用户实时拍出更加美观的图片。对比现有技术,本发明采用的网络结构模型能更加有效的提取图像的特征,采用的损失函数,极大增强了模型对数据的学习能力,相比于其他方法既提高了准确率,又减少了模型的参数量。
搜索关键词: 一种 基于 注意力 机制 图像 美学 质量 评价 方法
【主权项】:
1.一种基于注意力机制的图像美学质量评价方法,其特征在于,包括以下步骤:/n步骤1:设计网络结构模型;/n网络结构模型为:主干网络用n层深度可分离卷积层(Depthwise Separableconvolutions),主干网络中任意位置插入注意力模块,主干网络后接全局均值池化层(GlobalAverage Pooling)、全连接层以及softmax层;注意力模块用于模拟人的视觉机制,对于图像中的重点区域赋予较大的权重;/n步骤2:设计用于训练网络的损失函数;/n采用下述基于数据均衡的bEMD损失作为损失函数:/n /n其中,p为真实值得分的概率分布,为预测值得分的概率分布;Si为第i张图片的评分人数,为整个数据集中图片的平均评分人数,N为数据集中图片的总数;CDFp(k)是真实得分累积分布函数表示图片第j个真实分值的概率,k表示分值的总数;是预测得分累积分布函数表示图片第j个预测分值的概率;除去权重部分,该公式为CDFp(k)和的闵可夫斯基距离(Minkowski Distance)定义,r=1为曼哈顿距离、r=2为欧氏距离、r→∞时为切比雪夫距离;/n步骤3:处理训练数据;/n将训练数据处理成满足网络结构模型要求的大小;/n步骤4:用步骤3中处理好的训练数据、步骤2的损失函数,训练步骤1的网络结构模型得到图像美学质量评价网络;/n步骤5:输入图片进行美学评分;/n将待评价的图片缩放至所述网络结构模型要求的大小,输入所述图像美学质量评价网络中,得到该图片的每一个评分的概率分布,通过下述公式计算该分布的均值得到图片的美学得分μ:/n /n其中,bi为第i个分值,表示第i个分值的概率,K表示分值的总数。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201910553271.2/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top