[发明专利]周期性综合包络序列生成装置、方法、记录介质有效
申请号: | 201910432900.6 | 申请日: | 2015-02-20 |
公开(公告)号: | CN110289008B | 公开(公告)日: | 2022-10-21 |
发明(设计)人: | 守谷健弘;镰本优;原田登 | 申请(专利权)人: | 日本电信电话株式会社 |
主分类号: | G10L19/06 | 分类号: | G10L19/06;G10L19/02 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 郑海涛 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 周期性 综合 包络 序列 生成 装置 方法 记录 介质 | ||
提供能够提高音频信号的基音周期引起的波峰的附近的近似精度的包络序列。本发明的周期性综合包络序列生成装置,将预定的时间区间即帧单位的时域的音频数字信号作为输入音频信号,作为包络序列而生成周期性综合包络序列。本发明的周期性综合包络序列生成装置至少包括频谱包络序列计算部和周期性综合包络生成部。频谱包络序列计算部基于输入音频信号的时域的线性预测,计算输入音频信号的频谱包络序列。周期性综合包络生成部基于输入音频信号在频域中的周期性分量,对频谱包络序列进行变形,并设为周期性综合包络序列。
本申请为以下专利申请的分案申请:申请日为2015年2月20日,申请号为201580022816.7,发明名称为“周期性综合包络序列生成装置、周期性综合包络序列生成方法、生成程序、记录介质”。
技术领域
本发明涉及对音频信号的频谱包络进行计算的周期性综合包络序列生成装置、周期性综合包络序列生成方法、周期性综合包络序列生成程序、以及记录介质。
背景技术
作为低比特(例如10kbit/s~20kbit/s左右)的语音信号或音频信号的编码方法,已知DFT(离散傅里叶变换)或MDCT(变形离散余弦变换)等对于正交变换系数的自适应编码。例如在非专利文献1中使用的TCX(transform coded excitation:变换编码激励)编码方法中,求出从作为所输入的声音信号的频域表现的系数串X[1],…,X[N]消除了振幅频谱包络的影响的序列(归一化序列串XN[1],…,XN[N]),并对其进行可变长度编码。其中,[]内的N是正整数。
振幅频谱包络通过以下的步骤算出。
(步骤1)以作为预定的时间区间的帧单位,进行对所输入的时域的音频数字信号(以下,输入音频信号)的线性预测分析从而求出线性预测系数α1,…,αP。其中,P是表示预测阶数的正整数。例如,通过作为全极点模型的P阶自回归过程,在时刻t的输入音频信号x(t),根据回溯至P时点的过去的自身的值x(t-1),…,x(t-P)、预测残差e(t)、以及线性预测系数α1,…,αP,通过式(1)表示。
x(t)=α1x(t-1)+…+αp x(t-P)+e(t) (1)
(步骤2)对线性预测系数α1,…,αP进行量化,求出已量化线性预测系数^α1,…,^αP。使用已量化线性预测系数^α1,…,^αP求出N点的输入音频信号的振幅频谱包络序列W[1],…,W[N]。例如,振幅频谱包络序列的各值W[n]能够通过式(2)求出。其中,n是1≦n≦N的整数,exp(·)是以纳皮尔数作为底的指数函数,j是虚数单位,σ是预测残差信号的振幅。
另外,在本说明书中,在右上角以没有用括号的方式标记的符号表示幂乘运算。也就是说,σ2表示σ的平方。此外,文中使用的符号“~”、“^”等本来应记载在紧随其后的字符的正上方,但由于文本记法的限制,记载在该字符的紧跟前。在数学式中这些符号表示在本来的位置、即字符的正上方。
[现有技术文献]
[非专利文献]
[非专利文献1]Anthony Vetro,“MPEG Unified Speech and Audio Coding”,Industry and Standards,IEEE MultiMedia,April-June,2013.
发明内容
发明要解决的课题
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于日本电信电话株式会社,未经日本电信电话株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910432900.6/2.html,转载请声明来源钻瓜专利网。