[发明专利]视频文件的生成方法、装置、终端及存储介质有效
申请号: | 201910974857.6 | 申请日: | 2019-10-14 |
公开(公告)号: | CN112738634B | 公开(公告)日: | 2022-08-02 |
发明(设计)人: | 郑微;吕伟伟 | 申请(专利权)人: | 北京字节跳动网络技术有限公司 |
主分类号: | H04N21/472 | 分类号: | H04N21/472;H04N21/431;H04N21/439;H04N21/44 |
代理公司: | 北京新知远方知识产权代理事务所(普通合伙) 11397 | 代理人: | 马军芳;张艳 |
地址: | 100041 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频文件 生成 方法 装置 终端 存储 介质 | ||
1.一种视频文件的生成方法,其特征在于,所述方法包括:
响应于接收到的视频编辑指令,呈现视频编辑界面,所述视频编辑界面中包括图像选择按键、音频选择按键中至少之一;
响应于针对所述视频编辑界面所包括按键的点击操作,确定用于进行视频合成的目标音频和目标图像;
获取所述目标音频的各音频帧对应的音频参数;
基于获取的各所述音频参数,生成对应各所述音频帧的频谱图;
对所述目标图像进行模糊处理,得到对应的模糊目标图像;
对所述目标图像进行目标区域截取,得到目标区域图像;
分别将所述目标区域图像与各所述音频帧的频谱图进行组合,得到对应的多个组合图像;
分别以各所述组合图像为前景、以所述模糊目标图像为背景,生成对应的多个包含所述频谱图的视频帧图像;
基于所述多个视频帧图像及所述目标音频,进行视频编码,得到目标视频文件。
2.如权利要求1所述的方法,其特征在于,所述基于获取的各所述音频参数,生成对应各所述音频帧的频谱图,包括:
基于预设采样频率,对所述目标音频进行采样处理,得到采样后的多个音频帧对应的音频参数;
分别对各所述采样后的音频帧的音频参数进行傅里叶变换,生成对应各所述采样后的音频帧的频谱图。
3.如权利要求2所述的方法,其特征在于,所述生成对应各所述采样后的音频帧的频谱图,包括:
确定对应的各所述音频帧的振幅;
基于各所述音频帧的振幅,确定多个对应所述频谱图的频谱包络线;
分别将各所述频谱包络线与对应的各所述频谱图进行组合,得到对应的多个组合后的频谱图。
4.如权利要求1所述的方法,其特征在于,所述对所述目标图像进行目标区域截取,得到目标区域图像,包括:
确定所述目标图像中目标对象对应的区域;
基于确定的所述区域,进行包括所述目标对象的目标形状的区域截取,得到所述目标区域图像。
5.如权利要求1所述的方法,其特征在于,所述分别将所述目标区域图像与各所述音频帧的频谱图进行组合之前,所述方法还包括:
对所述模糊目标图像进行颜色特征提取,得到对应所述模糊目标图像的各个像素点的颜色特征;
对各所述像素点的颜色特征进行加权求平均,确定所述模糊目标图像的颜色;
将确定的所述模糊目标图像的颜色,作为所述频谱图的颜色。
6.如权利要求1所述的方法,其特征在于,所述频谱图为柱状频谱图,所述分别将所述目标区域图像与各所述音频帧的频谱图进行组合,得到对应的多个组合图像,包括:
分别将所述柱状频谱图环绕在所述目标区域图像的周围,形成对应的多个组合图像;
其中,所述柱状频谱图中的频谱柱高度表征对应的所述音频帧的振幅,所述柱状频谱图中的频谱柱在所述目标区域图像的边缘的分布角度表征对应的所述音频帧的频率。
7.如权利要求1所述的方法,其特征在于,所述分别以各所述组合图像为前景、以所述模糊目标图像为背景,生成对应的多个包含所述频谱图的视频帧图像,包括:
获取目标音频帧的相邻音频帧对应的视频帧图像呈现的前景与背景的相对位置关系;
基于获取的所述相对位置关系,生成对应所述目标音频帧的视频帧图像;对应所述目标音频帧的视频帧图像中的前景的呈现位置,相较于所述相邻音频帧对应的视频帧图像中前景的呈现位置发生预设角度的旋转。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京字节跳动网络技术有限公司,未经北京字节跳动网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910974857.6/1.html,转载请声明来源钻瓜专利网。