[发明专利]参数决定装置、方法及记录介质有效
申请号: | 201680007107.6 | 申请日: | 2016-01-27 |
公开(公告)号: | CN107430869B | 公开(公告)日: | 2020-06-12 |
发明(设计)人: | 守谷健弘;镰本优;原田登;龟冈弘和;杉浦亮介 | 申请(专利权)人: | 日本电信电话株式会社;国立大学法人东京大学 |
主分类号: | G10L25/03 | 分类号: | G10L25/03;G10L25/18;G10L19/038;G10L19/07;G10L19/02;G10L19/16;H03M7/30;G10L25/21 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 郑海涛 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 参数 决定 装置 方法 记录 介质 | ||
参数决定装置具备:频谱包络估计单元(42),将参数η0及参数η设为正数,使用通过规定的方法而决定的参数η0,将与时序信号对应的频域样本串的绝对值的η0次方视为功率谱而进行频谱包络的估计;白色化频谱序列生成单元(43),得到将频域样本串除以频谱包络后的序列即白色化频谱序列;以及参数取得单元(44),求得以参数η为形状参数的一般化高斯分布近似白色化频谱序列的直方图的参数η。
技术领域
本发明涉及在音信号等时序信号的编码技术中,决定表示音信号等时序信号的特征的参数的技术。
背景技术
作为表示音信号等时序信号的特征的参数,已知LSP等参数(例如,参照非专利文献1)。
由于LSP包含多个值,因此直接使用于音的分类、区间估计则有时处理困难。例如,由于LSP包含多个值,所以基于使用了LSP的阈值的处理不能说容易。
然而,虽然并非公知,但由发明人提出了参数η。该参数η是,例如在3GPP EVS(增强语音服务(Enhanced Voice Services))标准中使用的对利用线性预测包络的频域的系数的量化值进行算术编码的编码方式中,决定算术码的编码对象所属的概率分布的形状参数。参数η与编码对象的分布具有关联性,若适当决定参数η,则能够进行效率高的编码及解码。
此外,参数η能够成为表示时序信号的特征的指标。因此,参数η能够用于上述编码处理以外的技术、例如音的分类、音区间的估计等声音音响关联技术。
进而,由于参数η包含一个值,所以基于使用了参数η的阈值的处理与基于使用了LSP的阈值的处理相比更容易。因此,参数η能够容易地用于音的分类、区间估计。
现有技术文献
非专利文献
非专利文献1:守谷健弘,“高圧縮音声符号化の必須技術:線スペクトル対(LSP)”,NTT技術ジャーナル,2014年9月,P.58-60
发明内容
发明要解决的课题
决定参数η的技术此前没有被提出。
本发明的目的在于,提供决定参数η的参数决定装置、方法、程序及记录介质。
用于解决课题的手段
根据本发明的一方式的参数决定装置,具备:频谱包络估计单元,将参数η0及参数η设为正数,使用通过规定的方法而决定的参数η0,将与时序信号对应的频域样本串的绝对值的η0次方视为功率谱而进行频谱包络的估计;白色化频谱序列生成单元,得到将上述频域样本串除以频谱包络后的序列即白色化频谱序列;以及参数取得单元,求得以参数η为形状参数的一般化高斯分布近似上述白色化频谱序列的直方图的参数η。
发明效果
能够决定参数η。
附图说明
图1是用于说明参数决定装置的例子的框图。
图2是用于说明参数决定方法的例子的流程图。
图3是用于说明一般化高斯分布的图。
图4是用于说明编码装置的例子的框图。
图5是用于说明编码方法的例子的流程图。
图6是用于说明编码单元的处理的例子的流程图。
图7是用于说明编码单元的例子的框图。
图8是用于说明编码单元的例子的框图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于日本电信电话株式会社;国立大学法人东京大学,未经日本电信电话株式会社;国立大学法人东京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201680007107.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:沉浸式可视化系统中用户语音的实时重构
- 下一篇:低功率语音命令检测器