[发明专利]视频录制处理方法、视频播放控制方法及电子设备在审
申请号: | 202011405870.9 | 申请日: | 2020-12-03 |
公开(公告)号: | CN112584225A | 公开(公告)日: | 2021-03-30 |
发明(设计)人: | 高志稳 | 申请(专利权)人: | 维沃移动通信有限公司 |
主分类号: | H04N21/433 | 分类号: | H04N21/433;H04N21/439;H04N21/422;G10L17/02;G10L13/00 |
代理公司: | 北京银龙知识产权代理有限公司 11243 | 代理人: | 黄灿;赵品健 |
地址: | 523863 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 录制 处理 方法 播放 控制 电子设备 | ||
1.一种视频录制处理方法,其特征在于,包括:
在视频录制的过程中,确定视频帧中用户的声纹特征;
基于所述声纹特征确定录音数据中与所述用户关联的语音信息,所述录音数据为所述视频录制产生的语音数据;
保存所述用户与所述语音信息的关联关系。
2.根据权利要求1所述的方法,其特征在于,在视频录制的过程中,确定图像画面中至少一个用户的声纹特征包括:
在视频录制的过程中,获取多个麦克风采集的语音数据以及至少两个摄像头采集的图像数据;
根据所述多个麦克风采集的语音数据确定声源的第一位置信息,并根据图像数据确定目标语音用户的第二位置信息;
在当前仅存在一个声源,且所述声源的第一位置信息与所述第二位置信息匹配的情况下,提取所述声源的声纹特征;
将所述声纹特征确定为所述目标语音用户的声纹特征。
3.根据权利要求1所述的方法,其特征在于,所述基于所述声纹特征确定录音数据中与所述用户关联的语音信息的步骤包括:
提取所述录音数据中与所述声纹特征匹配的目标语音数据,将所述目标语音数据确定为所述语音信息;
所述保存所述用户与所述语音信息的关联关系的步骤包括:
将所述目标语音数据存储至与所述用户关联的储存位置。
4.一种视频播放控制方法,其特征在于,包括:
接收对录制的目标视频的视频帧中第一用户的第一输入;
响应于所述第一输入,基于所述第一用户关联的语音信息进行语音的播放控制。
5.根据权利要求4所述的方法,其特征在于,所述基于所述第一用户关联的语音信息进行语音的播放控制的步骤包括:
基于所述第一用户关联的语音信息,播放所述第一用户的语音数据。
6.根据权利要求5所述的方法,其特征在于,基于所述第一用户关联的语音信息,播放所述第一用户的语音数据包括以下任一项:
在播放所述目标视频的过程中,仅播放所述目标视频对应的录音数据中第一语音数据,所述第一语音数据基于所述第一用户关联的语音信息确定;
所述语音信息为第二语音数据的情况下,暂停播放所述目标视频,仅播放所述第二语音数据,所述第二语音数据为预先基于所述第一用户的声纹特征,从所述目标视频对应的录音数据中获取的语音数据。
7.根据权利要求4所述的方法,其特征在于,所述基于所述第一用户关联的语音信息进行语音的播放控制包括:
确定所述第一输入关联的目标音量值;
在播放所述目标视频的过程中,将所述第一用户的语音数据对应的音量调整为所述目标音量值。
8.一种视频录制处理装置,其特征在于,包括:
第一确定模块,用于在视频录制的过程中,确定视频帧中用户的声纹特征;
第二确定模块,用于基于所述声纹特征确定录音数据中与所述用户关联的语音信息,所述录音数据为所述视频录制产生的语音数据;
存储模块,用于保存所述用户与所述语音信息的关联关系。
9.根据权利要求8所述的装置,其特征在于,所述第一确定模块包括:
获取单元,用于在视频录制的过程中,获取多个麦克风采集的语音数据以及至少两个摄像头采集的图像数据;
第一确定单元,用于根据所述多个麦克风采集的语音数据确定声源的第一位置信息,并根据图像数据确定目标语音用户的第二位置信息;
提取单元,用于在当前仅存在一个声源,且所述声源的第一位置信息与所述第二位置信息匹配的情况下,提取所述声源的声纹特征;
第二确定单元,用于将所述声纹特征确定为所述目标语音用户的声纹特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于维沃移动通信有限公司,未经维沃移动通信有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011405870.9/1.html,转载请声明来源钻瓜专利网。