[发明专利]视频文件的生成方法、装置、终端及存储介质有效
申请号: | 201910974857.6 | 申请日: | 2019-10-14 |
公开(公告)号: | CN112738634B | 公开(公告)日: | 2022-08-02 |
发明(设计)人: | 郑微;吕伟伟 | 申请(专利权)人: | 北京字节跳动网络技术有限公司 |
主分类号: | H04N21/472 | 分类号: | H04N21/472;H04N21/431;H04N21/439;H04N21/44 |
代理公司: | 北京新知远方知识产权代理事务所(普通合伙) 11397 | 代理人: | 马军芳;张艳 |
地址: | 100041 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频文件 生成 方法 装置 终端 存储 介质 | ||
本公开实施例提供一种视频文件的生成方法、装置、终端及存储介质;方法包括:响应于接收到的视频编辑指令,呈现视频编辑界面,所述视频编辑界面中包括图像选择按键、音频选择按键中至少之一;响应于针对所述视频编辑界面所包括按键的点击操作,确定用于进行视频合成的目标音频和目标图像;获取所述目标音频的各音频帧对应的音频参数;基于获取的各所述音频参数,生成对应各所述音频帧的频谱图;基于生成的所述频谱图及所述目标图像,生成对应各所述音频帧的包含所述频谱图的多个视频帧图像;基于所述多个视频帧图像及所述目标音频,进行视频编码,得到目标视频文件。
技术领域
本公开实施例涉及图像处理领域,尤其涉及一种视频文件的生成方法、装置、终端及存储介质。
背景技术
随着科学技术的发展,音乐数据不仅能够被听到,还可以被“看到”,音乐的可视化技术已被广泛应用于音乐播放场景中。相关技术中,基于音乐数据的频谱特征实现音乐波形的可视化,然而,此种技术仅考虑音频数据本身,忽略其他附加因素,从而导致呈现的可视化效果单一,不能满足用户的多样化需求。
发明内容
提供该发明内容部分以便以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。该发明内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
第一方面,本公开实施例提供了一种视频文件的生成方法,包括:
响应于接收到的视频编辑指令,呈现视频编辑界面,所述视频编辑界面中包括图像选择按键、音频选择按键中至少之一;
响应于针对所述视频编辑界面所包括按键的点击操作,确定用于进行视频合成的目标音频和目标图像;
获取所述目标音频的各音频帧对应的音频参数;
基于获取的各所述音频参数,生成对应各所述音频帧的频谱图;
基于生成的所述频谱图及所述目标图像,生成对应各所述音频帧的包含所述频谱图的多个视频帧图像;
基于所述多个视频帧图像及所述目标音频,进行视频编码,得到目标视频文件。
上述方案中,所述基于获取的各所述音频参数,生成对应各所述音频帧的频谱图,包括:
基于预设采样频率,对所述目标音频进行采样处理,得到采样后的多个音频帧对应的音频参数;
分别对各所述采样后的音频帧的音频参数进行傅里叶变换,生成对应各所述采样后的音频帧的频谱图。
上述方案中,所述基于获取的各所述音频参数,生成对应各所述音频帧的频谱图,包括:
基于获取的所述音频参数,确定对应的各所述音频帧的振幅;
基于各所述音频帧的振幅,确定多个对应所述频谱图的频谱包络线;
分别将各所述频谱包络线与对应的各所述频谱图进行组合,得到对应的多个组合后的频谱图。
上述方案中,所述基于生成的所述频谱图及所述目标图像,生成对应各所述音频帧的包含所述频谱图的多个视频帧图像,包括:
对所述目标图像进行模糊处理,得到对应的模糊目标图像;
对所述目标图像进行目标区域截取,得到目标区域图像;
分别将所述目标区域图像与各所述音频帧的频谱图进行组合,得到对应的多个组合图像;
分别以各所述组合图像为前景、以所述模糊目标图像为背景,生成对应的多个包含所述频谱图的视频帧图像。
上述方案中,所述对所述目标图像进行目标区域截取,得到目标区域图像,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京字节跳动网络技术有限公司,未经北京字节跳动网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910974857.6/2.html,转载请声明来源钻瓜专利网。