[发明专利]通过音乐情感识别视频广告的方法有效
申请号: | 201910384279.0 | 申请日: | 2019-05-09 |
公开(公告)号: | CN110162671B | 公开(公告)日: | 2023-01-03 |
发明(设计)人: | 孙伟芳;张勇;董培祥 | 申请(专利权)人: | 央视国际网络无锡有限公司 |
主分类号: | G06F16/783 | 分类号: | G06F16/783;G06F16/75;G06Q30/02 |
代理公司: | 常州佰业腾飞专利代理事务所(普通合伙) 32231 | 代理人: | 顾翰林 |
地址: | 214000 江苏省无锡市震*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 通过 音乐 情感 识别 视频 广告 方法 | ||
本发明公开了一种通过音乐情感识别视频广告的方法,包括:S1获取音乐文件集,并根据Valence‑Arousal二维空间对音乐文件集中的音乐文件打分,得到各音乐文件的V‑A真值;S2分别提取音乐文件集中音乐文件的特征,使用音乐文件的特征作为输入、V‑A真值作为输出对音乐情感识别模型进行训练,完成音乐情感识别模型的搭建;S3获取配乐的待识别视频,并每间隔一定时间作为一个节点提取音乐特征;S4将提取的音乐特征输入训练好的音乐情感识别模型得到相应节点的V‑A预测值;S5根据得到的各节点的V‑A预测值对视频中的广告进行识别。基于音乐计算数据较视频更小,差异性更突出,因此该方法效率和识别率都更高,能够节省时间的同时节省计算资源和人力资源。
技术领域
本发明涉及多媒体技术领域,尤其涉及一种视频广告识别方法。
背景技术
目前,多媒体视频广泛流传,视频中的广告片段形式多种多样,数量庞大,很大程度上加大了视频资料保存和二次制作的难度。对于视频资源二次制作和保存的厂商/个人来说,快捷方便有效地去除视频中的广告能够节省存储空间的同时方便使用,进而这一需求成为了很多公司和研究人员研究开发的热点。
目前,绝大部分厂商或个人仍然通过人工识别的方式去除视频中的广告,这种方法不仅效率低下,而且成本高。此外,有一部分厂商或个人通过视频图片相似度比对的方式去除广告,但是这种方法会消耗大量的资源,且针对不同类别广告的识别鲁棒性不好。
发明内容
针对上述现有技术的不足,本发明提供了一种通过音乐情感识别视频广告的方法,有效解决现有技术中视频广告识别成本高、耗费大量资源的技术问题。
为了实现上述目的,本发明通过以下技术方案实现:
一种通过音乐情感识别视频广告的方法,包括:
S1获取音乐文件集,并根据Valence-Arousal二维空间对音乐文件集中的音乐文件打分,得到各音乐文件的V-A真值;
S2分别提取音乐文件集中音乐文件的特征,使用音乐文件的特征作为输入、V-A真值作为输出对音乐情感识别模型进行训练,完成音乐情感识别模型的搭建;
S3获取配乐的待识别视频,并每间隔一定时间作为一个节点提取音乐特征;
S4将提取的音乐特征输入训练好的音乐情感识别模型得到相应节点的V-A预测值;
S5根据得到的各节点的V-A预测值对视频中的广告进行识别。
进一步优选地,在步骤S2中包括:
S21分别提取音乐文件集中音乐文件的特征,所述特征包括:音乐的音色特征、韵律特征及强度特征;
S22将音乐文件集分为训练集和测试集;
S23根据训练集使用其中的音乐文件的特征作为输入、V-A真值作为输出对音乐情感识别模型进行训练;
S24根据测试集对音乐情感识别模型进行进一步优化调整,完成音乐情感识别模型的搭建。
进一步优选地,V-A真值中包括Valence值和Arousal值;
当Valence0,Arousal0,代表高兴、快乐、兴奋类情绪,此时,0°θ90°,且随着角度增大情绪强度增强,其中,θ=arctan(Arousal/Valence);
当Valence0,Arousal0,代表害怕、愤怒、悲痛类情绪,此时,90°θ180°,且随着角度增大情绪强度减弱,其中,θ=180°+arctan(Arousal/Valence);
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于央视国际网络无锡有限公司,未经央视国际网络无锡有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910384279.0/2.html,转载请声明来源钻瓜专利网。