[发明专利]动漫作品封面图提取方法及其系统有效
申请号: | 201910334040.2 | 申请日: | 2019-04-24 |
公开(公告)号: | CN110069664B | 公开(公告)日: | 2021-04-06 |
发明(设计)人: | 王再励;胡晓军 | 申请(专利权)人: | 北京博视未来科技有限公司 |
主分类号: | G06F16/74 | 分类号: | G06F16/74;G06K9/00 |
代理公司: | 成都正华专利代理事务所(普通合伙) 51229 | 代理人: | 何凡 |
地址: | 100082 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 动漫 作品 封面 提取 方法 及其 系统 | ||
1.动漫作品封面图提取方法,其特征在于,包括:
S1、获取待提取的指定角色作为封面图的动漫视频,并以固定间隔对所述动漫视频进行抽帧,得到若干图片帧;
S2、根据指定角色对应的动漫作品,在存储的已训练的动漫人物识别模型库中查找并读入该动漫作品中人物的深度神经网络模型;
S3、采用深度神经网络检测并输出每帧图片帧中指定角色的头部和身体所在矩形框的置信度大于设定阈值的置信度;
S4、根据图片帧中头部、身体的置信度判断图片帧中是否检测到指定角色,若检测到,则保留相应图片帧并进入步骤S5,否则删除相应图片帧;
S5、根据图片帧中角色的头部和身体检测情况,采用对应的更正系数乘以头部置信度得到每帧图片帧的角色检测置信度;
S6、采用像素空间域的二维滑动窗口算法提取每帧图片帧中最小代价值的滑窗框;
S7、根据角色检测置信度,采用滑窗算法计算每帧图片帧的信任度;以及
S8、选取设定数量信任度最高的图片帧,并截取图片帧中最小代价值对应的滑窗框作为封面备选图;
采用像素空间域的二维滑动窗口算法选择每帧图片帧中最小代价值的滑窗框输出进一步包括:
S61、初始化滑窗框的初始行中点索引r=s/2+1,初始列中点索引c=s/2+1,行、列索引的滑动步长为dr=dc=s,其中,s为基准步长;
S62、根据基准步长s、行中点索引r及列中点索引c框出图片帧上的当前滑窗框,当前滑窗框左上角坐标xhead为((c-s*ω/2),(r-s/2)),宽whead为(s*ω),高为s,ω为输出封面图的宽高比;
S63、根据当前滑窗框的坐标、宽和高,计算当前滑窗框与角色头部框的重合面积,并判断重合面积是否大于头部框总面积的90%,若大于,则进入步骤S64,否则进入步骤S66;
S64、采用代价函数计算当前滑窗框的代价值;
S65、当当前滑窗框的代价值大于当前图片帧存储的最小代价值时,存储当前滑窗框,采用该代价值更新当前图片帧存储的最小代价值,之后进入步骤S66;
S66、判断c-s*ω/2是否大于等于图片帧总宽度,若是,进入步骤S67,否则更新c=c+dc,返回步骤S62;
S67、判断r-s/2是否大于等于图片帧总高度,若是,则进入步骤S68,否则更新r=r+dr,c=s/2+1,返回步骤S62;
S68、判断s是否大于图片帧的高或s*ω是否大于图片帧的宽,若其中任一大于,则输出当前图片帧存储的最小代价值对应的滑窗框,否则更新s=s*β,β为步长拓展因子,返回步骤S61;
采用代价函数计算当前滑窗框的代价值包括:
计算角色头部左右居中的代价值costwidth:
costwidth=abs(c-(xhead+whead/2))/s/ω
其中,xhead为角色头部框的左上角横坐标,whead为角色头部框的宽度;
计算角色头部上下位置接近1/3位置的代价值costheight:
costheight=abs(r-(yhead+hhead/2)/s-0.33)
其中,yhead为角色头部框的左上角纵坐标,hhead为角色头部框的高度;
计算角色头部大小适中的代价值costsize:
costsize=abs(Shead/Swindow-0.5)
其中,Shead和Swindow分别为角色头部框与当前滑窗的面积;
根据角色头部的三个代价值,计算当前滑窗框的代价值:
cost=costwidth+costheight+costsize。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京博视未来科技有限公司,未经北京博视未来科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910334040.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:视频推荐方法及装置
- 下一篇:一种筛选项的提供方法、客户端及服务器