[发明专利]音频处理的方法、装置、电子设备及计算机可读存储介质有效
申请号: | 201811400323.4 | 申请日: | 2018-11-22 |
公开(公告)号: | CN109410912B | 公开(公告)日: | 2021-12-10 |
发明(设计)人: | 马永振;朱旭光;梅航;叶希喆 | 申请(专利权)人: | 深圳市腾讯信息技术有限公司 |
主分类号: | G10L13/02 | 分类号: | G10L13/02;G06F3/16;H04S7/00;H04S1/00 |
代理公司: | 北京市立方律师事务所 11330 | 代理人: | 张筱宁 |
地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 处理 方法 装置 电子设备 计算机 可读 存储 介质 | ||
本申请实施例提供了一种音频处理的方法、装置、电子设备及计算机可读存储介质,涉及多媒体技术领域,该方法包括:获取待处理的音频信息以及通过人头麦克风录制的音频信息,然后从待处理的音频信息中确定预设类型的音频信息,并将预设类型的音频信息通过预设插件进行处理,然后将通过人头麦克风录制的音频信息以及处理后的音频信息进行声音混音处理。本申请实施例可以提升声音的定位感以及空间感,进而可以提升用户在观看视频时的听觉体验。
技术领域
本申请涉及多媒体技术领域,具体而言,本申请涉及一种音频处理的方法、装置、电子设备及计算机可读存储介质。
背景技术
随着信息技术的发展,视频领域也进一步的发展,例如,手游电脑图像CG、虚拟现实VR游戏CG以及动态漫画等,为了使用户可以更好地感受视频内容,需要对合成在视频内容中的音频信息进行相应的处理,因此如何对合成在视频内容中的音频信息进行处理,以使得用户在观看视频内容时可以有更好的听觉体验,成为一个关键问题。
现有技术中,对与视频内容合成的音频信息通过高保真立体声响复制Ambisonics的方式进行处理,但是由于Ambisonics技术本身即为模糊化声源定位的技术手段,并且由于声音远场定位较差的限制因素,声音的定位感以及空间感表现不足,进而导致用户在观看视频时的听觉体验较差。
发明内容
本申请提供了一种音频处理的方法、装置、电子设备及计算机可读存储介质,用于解决声音的定位感以及空间感表现不足,以及用户在观看视频时体验较差的问题。所述技术方案如下所示:
第一方面,提供了一种音频处理的方法,该方法包括:
获取待处理的音频信息以及通过人头麦克风录制的音频信息;
从待处理的音频信息中确定预设类型的音频信息,并将预设类型的音频信息通过预设插件进行处理。
在一个可能的实现方式中,获取待处理的音频信息以及通过人头麦克风录制的音频信息,之前还包括:
在音频信息录制过程中,基于声源与各个麦克风之间的距离确定当前录制使用的麦克风;
通过确定出的麦克风进行录制对应的音频信息。
在一个可能的实现方式中,基于声源与各个麦克风之间的距离确定当前录制使用的麦克风;通过确定出的麦克风进行录制对应的音频信息,包括:
当检测到声源与人头麦克风之间的距离满足第一预设条件时,确定当前录制使用的麦克风为人头麦克风,并通过人头麦克风录制对应的音频信息;
当检测到声源与电容麦克风之间的距离满足第二预设条件时,确定当前录制使用的麦克风为电容麦克风,并通过电容麦克风录制对应的音频信息。
在一个可能的实现方式中,将通过人头麦克风录制的音频信息以及处理后的音频信息进行声音混音处理,包括:
将通过人头麦克风录制的音频信息以及处理后的音频信息通过线性叠加的方式进行声音混音处理。
在一个可能的实现方式中,将通过人头麦克风录制的音频信息以及处理后的音频信息通过线性叠加的方式进行声音混音处理,包括:
将通过人头麦克风录制的音频信息以及处理后的音频信息进行线性叠加;
将线性叠加后的混音信号按照音频强度大小划分为至少两个混音信号强度区间;
采用对应的收缩比例分别对各个混音信号强度区间进行音频强度收缩;
将经过音频强度收缩的至少两个混音信号强度区间进行叠加;
其中,混音信号区间所采用的收缩比例与混音信号强度区间对应的音频强度呈反比例关系。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市腾讯信息技术有限公司,未经深圳市腾讯信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811400323.4/2.html,转载请声明来源钻瓜专利网。