[发明专利]音视频数据处理方法及装置在审

申请号：	201910322621.4	申请日：	2019-04-22
公开（公告）号：	CN111833892A	公开（公告）日：	2020-10-27
发明（设计）人：	王行骏;王陈;黄龙滨	申请（专利权）人：	浙江宇视科技有限公司
主分类号：	G10L21/007	分类号：	G10L21/007;G10L21/0208;H04N7/18
代理公司：	北京超凡宏宇专利代理事务所(特殊普通合伙) 11463	代理人：	杨奇松
地址：	310000 浙江省杭州市滨江区西兴街道江陵路***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	视频数据处理方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请实施例提供了一种音视频数据处理方法及装置，在获得多路待处理音频数据后，针对各路待处理音频数据，根据所述待处理音频数据设定对应的降噪系数。再针对各路所述待处理音频数据，根据得到的所述降噪系数及预设规则设定对应的滤波系数，利用所述滤波系数对所述待处理音频数据进行滤波，得到待混音音频数据。如此，通过对待处理音频数据进行降噪系数获取、滤波及混音处理，有效降低噪声，改善了后续在视频文件中存在多路对讲音频时，出现的播放不连续及音量较低的问题，提高了用户体验。

技术领域

本申请涉及视频监控领域，具体而言，涉及一种音视频数据处理方法及装置。

背景技术

随着视频监控设施的发展，视频对讲技术也越来越成熟。例如，指挥中心查看摄像机实况时，可以和摄像机建立语音对讲。

但是若指挥中心或者摄像机本地开启视频存储，需要将对讲的音频数据保存到视频文件中时，根据对讲音频采集和接收的先后顺序写入视频文件，若音频路数大于一路，多路音频采用先到先存的原则写入文件，每路音频写入文件中的数据不连续。由于音频本质为振动波的特性，数据不连续破坏了每路对讲音频波形，导致播放视频文件时音频断断续续，用户体验较差。

如何解决多路对讲音频不连续的问题，提高视频中的对讲音频质量，是值得探究的问题。

发明内容

为了至少克服现有技术中的上述不足，本申请的目的之一在于提供一种音视频数据处理方法，所述方法包括：

获得多路待处理音频数据；

针对各路所述待处理音频数据，根据所述待处理音频数据设定降噪系数；

针对各路所述待处理音频数据，根据得到的所述降噪系数及预设规则设定对应的滤波系数，利用所述滤波系数对所述待处理音频数据进行滤波，得到待混音音频数据。

进一步地，所述针对各路所述待处理音频数据，根据所述待处理音频数据设定降噪系数的步骤包括：

针对各路所述待处理音频数据，获得所述待处理音频数据的当前第一采样点的值，并获得所述当前第一采样点对应的降噪系数；

根据所述当前第一采样点的值判断所述当前第一采样点是否是噪声点；

若所述当前第一采样点为噪声点，则增大所述降噪系数，若所述当前第一采样点不为噪声点，则降低所述降噪系数。

进一步地，所述针对各路所述待处理音频数据，根据得到的所述降噪系数及预设规则设定对应的滤波系数，利用所述滤波系数对所述待处理音频数据进行滤波，得到待混音音频数据的步骤包括：

根据得到的降噪系数及预设规则为各路所述待处理音频数据设定对应的滤波系数；