[发明专利]一种实时音频比对方法在审
申请号: | 201410814218.0 | 申请日: | 2015-08-04 |
公开(公告)号: | CN104505101A | 公开(公告)日: | 2015-07-29 |
发明(设计)人: | 张丹;胡志琳;李佳骅;石建 | 申请(专利权)人: | 北京巴越赤石科技有限公司 |
主分类号: | G10L25/51 | 分类号: | G10L25/51 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100033 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 实时 音频 方法 | ||
技术领域
本发明涉及一种判断两路实时音频信号的内容是否相同的比对方法。
背景技术
两路实时音频信号一般是经过不同的传输通道传入的,因为信道传输的延时,会造成两路信号在到达时间上的不同步。因此对这两路实时音频要做的第一件事情是进行同步计算,找出两路信号的延时大小。同步的结果会极大影响后续比对的准确度。
所以在实时音频的比对中,同步算法是最关键的模块。
现有技术中,判断两路音频信号是否同步,具有多种方法:
1)有辅助信息的同步,例如 “音频水印”技术,是在原始音频中插入一些额外的辅助信息,依靠这些辅助信息进行同步。这些特定的信息耳朵听不到,但是设备可以检测出来,用这些信息辅助进行同步。但这种方法一定程度上会降低声音的质量,另外前端需要安装特殊设备,提高了成本。
2)无辅助信息的同步,可以再细分为
a. 时间域上的同步计算:根据音频信号的时间特性的相关性来计算延时。可以使用的时间特性包括时域的信号包络,或者是音频能量的变化趋势等。这类算法的优点是计算量小,因为不需要变换到频域。缺点是很容易受到噪声、信道衰减的影响,准确率低,难以收敛。
b. 变换域上的同步计算:把音频信号变换到频域(或其他变换域),根据频域特征值的相关性来计算延时。这类算法的优点是准确性较高。由于利用了频域的特性,符合人耳辩声的原理,受噪声和衰减的影响小。缺点是涉及到时频变换,计算量大。
因此,现有的各种技术都存在缺陷,有待于进一步改进和发展。
发明内容
本发明的目的是提供一种计算量小,精度高的两路实时音频信号的对比方法。
为了实现上述目的,本发明采用如下技术方案:
一种实时音频比对方法,用于对两路实时的音频信号进行比较分析,判断两路信号是否为同样的内容,具体包括:
两路音频信号的初始同步和两路音频的周期比对;
所述两路音频信号的初始同步,包括以下步骤:
对第一路音频信号和第二路音频信号,分别读取N秒钟的音频,对两段音频进行采样得到两组待同步的音频采样序列;首先假设两路音频信号的延时值为D为D0,D0=0,进入第一级同步,也就是粗同步的过程;
通过假设的延时值D0,移动两路音频采样序列,使其在时间上对齐;然后从两路音频采样序列的同一时间点开始向后各取长度为M的同步测试音频序列,分别计算这两路同步测试音频序列的MEL倒谱特征值,得到两个同步测试音频序列的特征值序列;
对假定的延时值D0,减去和加上一个搜索步长S以后,分别得到两个新的假定延时值D1和D2。在延时值分别为D0、D1和D2时,分别计算这两个同步测试音频序列特征值的相关性值L0、L1和L2;
根据所述相关值,判断下一步搜索方向继续搜索,一直搜索到确定了最终的取值区间范围;
在这个区间内,缩小每一次搜索的步长S,也就是进入第二次同步即细同步,细同步的搜索步长小于粗同步;
最后找出具体的满足条件(相关性大于门限A)的延时值D值;
所述两路音频的周期比对包括以下步骤:
定期的对两路音频进行音频信号采样,计算两列采样音频序列的MEL倒谱特征值,然后比较他们的相关性;如果相关性仍然大于门限A,说明这段时间内两路音频还是保持内容一致的。
所述的实时音频比对方法,其中,所述计算这两个同步测试音频序列特征值的相关性值L0、L1和L2包括以下步骤:
以D0为假设延时,对齐所述两路音频采样序列,然后从两路音频采样序列的同一时间点开始向后各取长度为M的同步测试音频序列,分别计算这两路同步测试音频序列的MEL倒谱特征值,得到两个同步测试音频序列的特征值序列;计算这两个特征值序列的相关性值L0。
所述的实时音频比对方法,其中,所述计算这两个同步测试音频序列特征值的相关性值L0、L1和L2包括以下步骤:
假设两路音频信号的延时值为 D1=D0–S秒,以D1为延时对齐两列音频序列,然后从对齐后的两路音频序列的同一时间点处开始向后各取长度为M的音频采样序列,分别计算这两路同步测试音频序列的MEL倒谱特征值,得到两个同步测试音频序列的特征值序列;对这两个MEL倒谱特征值序列计算相关性得到相关值L1。
所述的实时音频比对方法,其中,所述计算这两个同步测试音频序列特征值的相关性值L0、L1和L2包括以下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京巴越赤石科技有限公司,未经北京巴越赤石科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410814218.0/2.html,转载请声明来源钻瓜专利网。