[发明专利]基于视频内容生成情感曲线的多源情感计算系统及方法有效

专利信息
申请号: 202110533941.1 申请日: 2021-05-17
公开(公告)号: CN113254713B 公开(公告)日: 2022-05-24
发明(设计)人: 牛建伟;杨森 申请(专利权)人: 北京航空航天大学
主分类号: G06F16/75 分类号: G06F16/75;G06V10/80;G06V10/764;G06V10/82;G06K9/62;G06N3/04
代理公司: 北京永创新实专利事务所 11121 代理人: 易卜
地址: 100191*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 视频 内容 生成 情感 曲线 计算 系统 方法
【说明书】:

发明公开一种基于视频内容生成情感曲线的多源情感计算系统及方法,涉及深度学习、计算机视觉、情感计算、音频处理和图像处理等技术。本系统包括视频内容特征提取模块、音频内容特征提取模块、特征融合回归模块和长视频分割与处理模块。本方法对从短视频片段中获取的视频和音频数据利用相应的特征提取卷积神经网络转换为视觉特征和听觉特征;对获取的视觉特征和听觉特征进行融合回归得到视频片段的情感值;最后组合输出长视频的情感序列,利用插值算法生成平滑的情感曲线。本发明实现了在计算机上计算视频情感变化曲线的自动化方法和系统,保留了观看者手工情感标注的特征,输出结果平滑自然,视觉效果更高,后续分析利用价值更大。

技术领域

本发明涉及深度学习技术、计算机视觉技术和视频处理技术,具体涉及一种基于视频内容生成情感曲线的多源情感计算系统及方法,是一种视频内容到情感曲线的生成技术。

背景技术

本发明所涉及的视频特指时长在1分钟以上的长视频,其通常包含视频内容和对应的音频数据。情感曲线特指视频带给观看者的情感反馈随时间的变化。情感由效价(Valence)和唤起(Arousal)2维情感值组成。效价表示情感的积极消极程度,唤起表示情感的强烈程度。计算视频的情感曲线是一项视频到情感曲线的转换任务,其目的为将输入的视频转化为情感曲线。近年来,基于深度学习的视频内容理解取得了显著进展,最近的研究提出了一系列系统的方法。例如,基于卷积神经网络(Convolutional Neural Network,CNN)方法;基于循环神经网络(Recurrent Neural Network,RNN)的方法。

然而,基于现有的技术,面向视频情感曲线的计算方法通常针对视频内容或音频内容进行计算,其难以利用综合的信息和特征,其生成的情感曲线变化与视频给观众带来的情感波动不符,无法直接作为视频的情感表示用于进一步处理。

发明内容

本发明的目的是提供一种基于二维和三维卷积神经网络,根据视频的视觉内容和听觉内容生成情感曲线的自动化方法和系统,以解决现有技术由视频生成情感表示的各种性能的综合效果较差的问题。

本发明基于视频内容生成情感曲线的多源情感计算系统,包括视频内容特征提取模块、音频内容特征提取模块、特征融合回归模块与长视频分割与处理模块。其中,视频内容特征提取模块用于从输入视频中提取视觉特征。音频内容特征提取模块用于计算输入视频的听觉特征。特征融合回归模块用于对视觉特征和听觉特征进行融合回归,并进行回归预测短视频对应的情感值。长视频分割与处理模块将输入的原始长视频分割成等长的短视频,再利用前述视频内容特征提取模块、音频内容特征提取模块和特征融合回归模块计算每个短视频的情感值,进行拼接组成整个长视频情感序列,然后对拼接后的长视频情感序列进行平滑化处理,得到原始输入视频的情感曲线。

针对上述基于视频内容生成情感曲线的多源情感计算系统,其多源情感计算方法为:

步骤1:通过视频切割工具将长视频V切割成等长度的短视频片段。

步骤2:各个短视频片段中提取视频采样帧,然后使用三维残差网络从连续的视频采样帧中提取短视频内容的视觉特征Featurevisual

步骤3:计算各个短视频片段中音频的梅尔频率倒谱系数,将音频的梅尔频率倒谱系数作为输入提取短视频的听觉特征Featureauditory

步骤4:对于每一个短视频片段,将提取的Featurevisual和Featureauditory进行融合,合并成统一的输入向量Feature,然后输入到回归器中,进而得到每一个短视频片段的情感值。

步骤5:对由前述步骤2~4得到每个短视频片段的情感值进行拼接形成长视频片段V的情感序列,并进行平滑处理。

相对于现有技术,本发明方法和系统的优点和积极效果在于:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110533941.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top