[发明专利]识别伪立体声音频的方法、装置及存储介质在审
申请号: | 201710721409.6 | 申请日: | 2017-08-21 |
公开(公告)号: | CN107659888A | 公开(公告)日: | 2018-02-02 |
发明(设计)人: | 劳振锋 | 申请(专利权)人: | 广州酷狗计算机科技有限公司 |
主分类号: | H04S1/00 | 分类号: | H04S1/00;G10L25/48 |
代理公司: | 深圳市世纪恒程知识产权代理事务所44287 | 代理人: | 胡海国 |
地址: | 510000 广东省广州市天河区科*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 识别 立体声 音频 方法 装置 存储 介质 | ||
技术领域
本发明涉及音频识别领域,尤其涉及一种识别伪立体声音频的方法、装置及存储介质。
背景技术
听歌已经成为人们娱乐生活的重要组成部分,在互联网及移动通信高速发展的今天,人们对听歌的需求已经不仅仅在于聆听前方一定范围的声音,而对还原声音的真实感和现场感提出了更高的要求,希望听到环绕周围的声音,这种三维化的声音即称为立体声。人耳能感知声源的不同定位并产生对声源的空间印象主要是由双耳时间差和双耳强度差决定,即双耳效应。立体声就是利用人耳的双耳效应,改变空间声像位置,还原声源声场,使听众有身临其境的听觉感受。所以一般现在的歌曲音频都是双声道音频,利用左右声道的信息差异使得歌曲听起来有立体感。但是有些音频虽然是双声道音频,但是听起来却干巴巴的完全没有立体感,这就是所谓的伪立体声音频。
现有的技术往往是只比较左右声道的波形信息是否一致来判断是否是伪立体声,这样虽然准确,但是由于对比波形信息的一致性,条件太严格,只有左右声道的波形信息完全一致才能将音频判断为伪立体声音频,使得可识别出的伪立体声音频的数量很少。
上述信息仅用于辅助理解本发明的技术方案,并不代表承认上述信息是现有技术。
发明内容
本发明的主要目的在于提供一种识别伪立体声音频的方法、装置及存储介质,旨在解决上述可识别出的伪立体声音频数量少的技术问题。
为实现上述目的,本发明提供一种识别伪立体声音频的方法,所述识别伪立体声音频的方法包括以下步骤:
获取当前音频的左声道波形信息和右声道波形信息;
将所述左声道波形信息按照预设划分规则分成第一预设数量的第一声波片段;
将所述右声道波形信息按照所述预设划分规则分成所述第一预设数量的第二声波片段;
计算各第一声波片段与对应的第二声波片段之间的第一相关度;
根据所述第一相关度计算所述左声道波形信息和右声道波形信息之间的第二相关度;
根据所述第二相关度判断所述当前音频是否为伪立体声音频。
优选地,所述根据所述第一相关度计算所述左声道波形信息和右声道波形信息之间的第二相关度,具体包括:
计算所述第一相关度的平均值,将所述平均值的绝对值作为所述第二相关度。
优选地,所述根据所述第二相关度判断所述当前音频是否为伪立体声音频,具体包括:
判断所述第二相关度是否大于预设阈值,在所述第二相关度大于所述预设阈值时,认定所述当前音频为伪立体声音频。
优选地,所述计算各第一声波片段与对应的第二声波片段之间的第一相关度,具体包括:
对所述第一声波片段进行遍历,将遍历到的第一声波片段作为当前声波片段;
计算所述当前声波片段与对应的第二声波片段之间的第一相关度。
优选地,所述计算所述当前声波片段与对应的第二声波片段之间的第一相关度,具体包括:
对所述当前声波片段进行采样,获得第二预设数量的第一采样点波形信息;
对与所述当前声波片段对应的第二声波片段进行采样,获得所述第二预设数量的第二采样点波形信息;
根据所述第二预设数量、所述第一采样点波形信息与所述第二采样点波形信息,计算所述当前声波片段与对应的第二声波片段之间的第一相关度。
优选地,所述根据所述第二预设数量、所述第一采样点波形信息与所述第二采样点波形信息,计算所述当前声波片段与对应的第二声波片段之间的第一相关度,具体包括:
根据所述第二预设数量、所述第一采样点波形信息及所述第二采样点波形信息,计算所述当前声波片段的第一波形方差、所述对应的第二声波片段的第二波形方差及所述当前声波片段与对应的第二声波片段之间的协方差;
根据所述第一波形方差、所述第二波形方差及所述协方差,计算所述当前声波片段与对应的第二声波片段之间的第一相关度。
优选地,所述根据所述第二预设数量、所述第一采样点波形信息及所述第二采样点波形信息,计算所述当前声波片段的第一波形方差、所述对应的第二声波片段的第二波形方差及所述当前声波片段与对应的第二声波片段之间的协方差,具体包括:
根据所述第二预设数量及所述第一采样点波形信息,计算所述当前声波片段的第一波形均值;
根据所述第二预设数量及所述第二采样点波形信息,计算所述对应的第二声波片段的第二波形均值;
根据所述第二预设数量、所述第一采样点波形信息及所述第一波形均值,计算所述当前声波片段的第一波形方差;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州酷狗计算机科技有限公司,未经广州酷狗计算机科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710721409.6/2.html,转载请声明来源钻瓜专利网。