[发明专利]基于视频内容生成情感曲线的多源情感计算系统及方法有效
申请号: | 202110533941.1 | 申请日: | 2021-05-17 |
公开(公告)号: | CN113254713B | 公开(公告)日: | 2022-05-24 |
发明(设计)人: | 牛建伟;杨森 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G06F16/75 | 分类号: | G06F16/75;G06V10/80;G06V10/764;G06V10/82;G06K9/62;G06N3/04 |
代理公司: | 北京永创新实专利事务所 11121 | 代理人: | 易卜 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 视频 内容 生成 情感 曲线 计算 系统 方法 | ||
本发明公开一种基于视频内容生成情感曲线的多源情感计算系统及方法,涉及深度学习、计算机视觉、情感计算、音频处理和图像处理等技术。本系统包括视频内容特征提取模块、音频内容特征提取模块、特征融合回归模块和长视频分割与处理模块。本方法对从短视频片段中获取的视频和音频数据利用相应的特征提取卷积神经网络转换为视觉特征和听觉特征;对获取的视觉特征和听觉特征进行融合回归得到视频片段的情感值;最后组合输出长视频的情感序列,利用插值算法生成平滑的情感曲线。本发明实现了在计算机上计算视频情感变化曲线的自动化方法和系统,保留了观看者手工情感标注的特征,输出结果平滑自然,视觉效果更高,后续分析利用价值更大。
技术领域
本发明涉及深度学习技术、计算机视觉技术和视频处理技术,具体涉及一种基于视频内容生成情感曲线的多源情感计算系统及方法,是一种视频内容到情感曲线的生成技术。
背景技术
本发明所涉及的视频特指时长在1分钟以上的长视频,其通常包含视频内容和对应的音频数据。情感曲线特指视频带给观看者的情感反馈随时间的变化。情感由效价(Valence)和唤起(Arousal)2维情感值组成。效价表示情感的积极消极程度,唤起表示情感的强烈程度。计算视频的情感曲线是一项视频到情感曲线的转换任务,其目的为将输入的视频转化为情感曲线。近年来,基于深度学习的视频内容理解取得了显著进展,最近的研究提出了一系列系统的方法。例如,基于卷积神经网络(Convolutional Neural Network,CNN)方法;基于循环神经网络(Recurrent Neural Network,RNN)的方法。
然而,基于现有的技术,面向视频情感曲线的计算方法通常针对视频内容或音频内容进行计算,其难以利用综合的信息和特征,其生成的情感曲线变化与视频给观众带来的情感波动不符,无法直接作为视频的情感表示用于进一步处理。
发明内容
本发明的目的是提供一种基于二维和三维卷积神经网络,根据视频的视觉内容和听觉内容生成情感曲线的自动化方法和系统,以解决现有技术由视频生成情感表示的各种性能的综合效果较差的问题。
本发明基于视频内容生成情感曲线的多源情感计算系统,包括视频内容特征提取模块、音频内容特征提取模块、特征融合回归模块与长视频分割与处理模块。其中,视频内容特征提取模块用于从输入视频中提取视觉特征。音频内容特征提取模块用于计算输入视频的听觉特征。特征融合回归模块用于对视觉特征和听觉特征进行融合回归,并进行回归预测短视频对应的情感值。长视频分割与处理模块将输入的原始长视频分割成等长的短视频,再利用前述视频内容特征提取模块、音频内容特征提取模块和特征融合回归模块计算每个短视频的情感值,进行拼接组成整个长视频情感序列,然后对拼接后的长视频情感序列进行平滑化处理,得到原始输入视频的情感曲线。
针对上述基于视频内容生成情感曲线的多源情感计算系统,其多源情感计算方法为:
步骤1:通过视频切割工具将长视频V切割成等长度的短视频片段。
步骤2:各个短视频片段中提取视频采样帧,然后使用三维残差网络从连续的视频采样帧中提取短视频内容的视觉特征Featurevisual。
步骤3:计算各个短视频片段中音频的梅尔频率倒谱系数,将音频的梅尔频率倒谱系数作为输入提取短视频的听觉特征Featureauditory。
步骤4:对于每一个短视频片段,将提取的Featurevisual和Featureauditory进行融合,合并成统一的输入向量Feature,然后输入到回归器中,进而得到每一个短视频片段的情感值。
步骤5:对由前述步骤2~4得到每个短视频片段的情感值进行拼接形成长视频片段V的情感序列,并进行平滑处理。
相对于现有技术,本发明方法和系统的优点和积极效果在于:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110533941.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种面膜全面检测装置
- 下一篇:一种用于汽车油箱的抱箍组件
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法