[发明专利]音视频数据处理方法及装置在审
申请号: | 201910322621.4 | 申请日: | 2019-04-22 |
公开(公告)号: | CN111833892A | 公开(公告)日: | 2020-10-27 |
发明(设计)人: | 王行骏;王陈;黄龙滨 | 申请(专利权)人: | 浙江宇视科技有限公司 |
主分类号: | G10L21/007 | 分类号: | G10L21/007;G10L21/0208;H04N7/18 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 杨奇松 |
地址: | 310000 浙江省杭州市滨江区西兴街道江陵路*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 数据处理 方法 装置 | ||
本申请实施例提供了一种音视频数据处理方法及装置,在获得多路待处理音频数据后,针对各路待处理音频数据,根据所述待处理音频数据设定对应的降噪系数。再针对各路所述待处理音频数据,根据得到的所述降噪系数及预设规则设定对应的滤波系数,利用所述滤波系数对所述待处理音频数据进行滤波,得到待混音音频数据。如此,通过对待处理音频数据进行降噪系数获取、滤波及混音处理,有效降低噪声,改善了后续在视频文件中存在多路对讲音频时,出现的播放不连续及音量较低的问题,提高了用户体验。
技术领域
本申请涉及视频监控领域,具体而言,涉及一种音视频数据处理方法及装置。
背景技术
随着视频监控设施的发展,视频对讲技术也越来越成熟。例如,指挥中心查看摄像机实况时,可以和摄像机建立语音对讲。
但是若指挥中心或者摄像机本地开启视频存储,需要将对讲的音频数据保存到视频文件中时,根据对讲音频采集和接收的先后顺序写入视频文件,若音频路数大于一路,多路音频采用先到先存的原则写入文件,每路音频写入文件中的数据不连续。由于音频本质为振动波的特性,数据不连续破坏了每路对讲音频波形,导致播放视频文件时音频断断续续,用户体验较差。
如何解决多路对讲音频不连续的问题,提高视频中的对讲音频质量,是值得探究的问题。
发明内容
为了至少克服现有技术中的上述不足,本申请的目的之一在于提供一种音视频数据处理方法,所述方法包括:
获得多路待处理音频数据;
针对各路所述待处理音频数据,根据所述待处理音频数据设定降噪系数;
针对各路所述待处理音频数据,根据得到的所述降噪系数及预设规则设定对应的滤波系数,利用所述滤波系数对所述待处理音频数据进行滤波,得到待混音音频数据。
进一步地,所述针对各路所述待处理音频数据,根据所述待处理音频数据设定降噪系数的步骤包括:
针对各路所述待处理音频数据,获得所述待处理音频数据的当前第一采样点的值,并获得所述当前第一采样点对应的降噪系数;
根据所述当前第一采样点的值判断所述当前第一采样点是否是噪声点;
若所述当前第一采样点为噪声点,则增大所述降噪系数,若所述当前第一采样点不为噪声点,则降低所述降噪系数。
进一步地,所述针对各路所述待处理音频数据,根据得到的所述降噪系数及预设规则设定对应的滤波系数,利用所述滤波系数对所述待处理音频数据进行滤波,得到待混音音频数据的步骤包括:
根据得到的降噪系数及预设规则为各路所述待处理音频数据设定对应的滤波系数;
针对各路所述待处理音频数据,获得所述待处理音频数据中的多个第二采样点,判断各所述第二采样点的绝对值是否大于所述滤波系数;
若所述第二采样点的绝对值大于所述滤波系数,则保持所述第二采样点的值不变,且降低所述降噪系数;
若所述第二采样点的绝对值等于或小于所述滤波系数,则将所述第二采样点的值置零,且增大所述降噪系数;
根据处理后得到的多个第二采样点获得所述待处理音频数据对应的待混音音频数据。
进一步地,所述根据得到的所述降噪系数及预设规则为各路所述待处理音频数据设定对应的滤波系数的步骤包括:
获得各路所述待处理音频数据中的当前第二采样点;
获得多个当前第二采样点中的最大值;
获得各所述当前第二采样点对应的降噪系数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江宇视科技有限公司,未经浙江宇视科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910322621.4/2.html,转载请声明来源钻瓜专利网。