[发明专利]通过音乐情感识别视频广告的方法有效
申请号: | 201910384279.0 | 申请日: | 2019-05-09 |
公开(公告)号: | CN110162671B | 公开(公告)日: | 2023-01-03 |
发明(设计)人: | 孙伟芳;张勇;董培祥 | 申请(专利权)人: | 央视国际网络无锡有限公司 |
主分类号: | G06F16/783 | 分类号: | G06F16/783;G06F16/75;G06Q30/02 |
代理公司: | 常州佰业腾飞专利代理事务所(普通合伙) 32231 | 代理人: | 顾翰林 |
地址: | 214000 江苏省无锡市震*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 通过 音乐 情感 识别 视频 广告 方法 | ||
1.一种通过音乐情感识别视频广告的方法,其特征在于,包括:
S1获取音乐文件集,并根据Valence-Arousal二维空间对音乐文件集中的音乐文件打分,得到各音乐文件的V-A真值;
S2分别提取音乐文件集中音乐文件的特征,使用音乐文件的特征作为输入、V-A真值作为输出对音乐情感识别模型进行训练,完成音乐情感识别模型的搭建;
S3获取配乐的待识别视频,并每间隔一定时间作为一个节点提取音乐特征;
S4将提取的音乐特征输入训练好的音乐情感识别模型得到相应节点的V-A预测值;
S5根据得到的各节点的V-A预测值对视频中的广告进行识别;
在步骤S5中包括:
S51从视频头开始,计算预设时间段δ秒内包含的节点的空间方位角θ的平均值m;
S52判断δ秒内是否存在空间方位角θ与平均值m间差值大于预设阈值ε的节点;若是,判定该节点对应的第t秒为疑似广告节点,并跳转至步骤S53;
S53在视频中计算下一个时间段δ秒内包含的节点的空间方位角θ的平均值m’,并根据步骤S52中的方法找到下一个疑似广告节点第t1秒;
S54根据两个疑似广告节点之间的时间差值识别视频中的广告。
2.如权利要求1所述的方法,其特征在于,在步骤S2中包括:
S21分别提取音乐文件集中音乐文件的特征,所述特征包括:音乐的音色特征、韵律特征及强度特征;
S22将音乐文件集分为训练集和测试集;
S23根据训练集使用其中的音乐文件的特征作为输入、V-A真值作为输出对音乐情感识别模型进行训练;
S24根据测试集对音乐情感识别模型进行进一步优化调整,完成音乐情感识别模型的搭建。
3.如权利要求1所述的方法,其特征在于,V-A真值中包括Valence值和Arousal值;
当Valence0,Arousal0,代表高兴、快乐、兴奋类情绪,此时,0°θ90°,且随着角度增大情绪强度增强,其中,空间方位角θ=arctan(Arousal/Valence);
当Valence0,Arousal0,代表害怕、愤怒、悲痛类情绪,此时,90°θ180°,且随着角度增大情绪强度减弱,其中,空间方位角θ=180°+arctan(Arousal/Valence);
当Valence0,Arousal0,代表伤心、沮丧、厌烦类情绪,此时,180°θ270°,且随着角度增大情绪强度减弱,其中,空间方位角θ=180°+arctan(Arousal/Valence);
当Valence0,Arousal0,代表满足、轻松、疲乏类情绪,此时,270°θ360°,且随着角度增大情绪强度增强,其中,空间方位角θ=360°+arctan(Arousal/Valence)。
4.如权利要求1所述的方法,其特征在于,在步骤S54中,若两个疑似广告节点之间的时间差值Δtδ,判断两个疑似广告节点间为视频内部的剧情切换;若ηΔtδ,判断两个疑似广告节点间为广告,其中,Δt=t1-t,η为预先设定阈值。
5.如权利要求4所述的方法,其特征在于,在步骤S54中,若判断两个疑似广告节点之间为广告,则截取两个节点之间的视频;
在截取过程中,根据预先设定的精度选定广告截取的秒数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于央视国际网络无锡有限公司,未经央视国际网络无锡有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910384279.0/1.html,转载请声明来源钻瓜专利网。