[发明专利]视频自动剪辑合成的方法及装置在审
申请号: | 201910372882.7 | 申请日: | 2019-05-06 |
公开(公告)号: | CN110121103A | 公开(公告)日: | 2019-08-13 |
发明(设计)人: | 郭凌含;朱志强 | 申请(专利权)人: | 郭凌含 |
主分类号: | H04N21/439 | 分类号: | H04N21/439;H04N21/44;H04N21/4402;H04N5/262;G06K9/00 |
代理公司: | 成都其高专利代理事务所(特殊普通合伙) 51244 | 代理人: | 廖曾 |
地址: | 200000 上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 图像帧 音频帧 图像帧数据 音频帧数据 视频剪辑 探测结果 自动剪辑 合成 指令 量化 声音识别 视频素材 视频特征 自动筛选 剪辑 探测 筛选 图像 | ||
1.一种视频自动剪辑合成的方法,其特征在于,所述视频自动剪辑合成的方法包括:
对初始视频进行图像和声音识别,以获得图像帧数据和音频帧数据;其中,所述图像帧数据和音频帧数据包括每个图像帧和图像帧的时间数据以及音频帧和音频帧的时间数据;
对图像帧数据和音频帧数据进行探测,得到图像帧数据和音频帧数据的探测结果;
获取视频剪辑指令;
根据图像帧数据和音频帧数据的探测结果,挑选符合视频剪辑指令的图像帧和音频帧;
将所挑选的图像帧和音频帧生成视频。
2.根据权利要求1所述的视频自动剪辑合成的方法,其特征在于,所述对图像帧数据和音频帧数据进行探测,得到图像帧数据和音频帧数据的探测结果,包括:
对音频帧数据进行探测,获取音频帧数据的声音频率数据和声音振幅数据;
对图像帧数据进行人物表情探测,获取图像帧数据中人物的表情特征数据;所述表情数据包括眨眼频率数据、眼睛大小数据、眉毛高度数据、嘴巴大小数据和鼻孔大小数据;
对图像帧数据进行人物动作探测,获取图像帧数据中人物的动作特征数据;
对图像帧数据进行光线探测,获取图像帧数据中光线的明暗度数据、光线频率数据、光线振幅数据和光线方向数据;
优选地,所述对图像帧数据进行人物表情探测,获取图像帧数据中人物的五官特征数据,包括:
对图像帧分别进行特征提取,识别图像帧中人物的人脸;
分别提取人脸中眼睛、眉毛、嘴巴和鼻孔的多个特征点,得到特征点的位置数据;
根据特征点之间的相对位置数据,判断图像帧中人物的表情;
再优选地,所述对图像帧数据进行人物动作探测,获取图像帧数据中人物的动作特征数据,包括:
对图像帧分别进行特征提取,识别图像帧中人物的身体;
分别提取身体手、脚、头、关节和躯干的多个特征点;
以躯干特征点为原点,分别计算手、脚、头和关节特征点相对于躯干特征点之间的相对坐标;
将相互连续的多个图像帧的躯干特征点重合并设为原点,分别得到手、脚、头和关节特征点的轨迹;
根据相互连续的多个图像帧的手、脚、头和关节特征点的轨迹,判断图像帧中人物的动作。
3.根据权利要求2所述的视频自动剪辑合成的方法,其特征在于,所述获取视频视频剪辑指令,包括:
预先设定视频剪辑指令;和/或
人为输入视频剪辑指令。
4.根据权利要求3所述的视频自动剪辑合成的方法,其特征在于,所述视频剪辑指令包括:表情指令、动作指令、声音指令和光线指令;
所述表情指令包括图像帧数据中人物的表情数据阈值;所述表情数据阈值包括眼睛特征点之间距离阈值、眉毛特征点与眼睛特征点之间距离阈值、嘴巴特征点之间距离阈值和鼻孔特征点之间距离阈值;
所述动作指令包括图像帧数据中人物的表情数据阈值;所述表情数据阈值包括手、脚、头和关节特征点的轨迹长度阈值,以及手、脚、头和关节特征点的移动速度阈值;
所述声音指令包括声音频率数据阈值和声音振幅数据阈值;
所述光线指令包括光线的明暗度数据阈值、光线频率数据阈值、光线振幅数据阈值和光线方向数据阈值。
5.根据权利要求4所述的视频自动剪辑合成的方法,其特征在于,所述将所挑选的图像帧和音频帧生成视频,包括:
对所挑选的视频帧进行编码以得到编码中的视频文件;
对所挑选的音频帧进行编码以得到编码中的音频文件;
结合图像帧的时间数据和音频帧的时间数据,生成与编码的视频文件和编码的音频文件对应的时间文件;
对编码的视频文件、音频文件和所述时间文件进行合成,以生成所述视频。
6.根据权利要求1所述的视频自动剪辑合成的方法,其特征在于,所述将所挑选的图像帧和音频帧生成视频之后,还包括:
将所生成所述视频进行修图工具处理形成精剪视频;
将所述精剪视频整合导出播放或上传网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郭凌含,未经郭凌含许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910372882.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种音频数据处理方法及装置
- 下一篇:视频剪辑方法及装置