[发明专利]确定谐波信号的特征在审
申请号: | 201680017664.6 | 申请日: | 2016-02-03 |
公开(公告)号: | CN107430850A | 公开(公告)日: | 2017-12-01 |
发明(设计)人: | 大卫·卡尔森·布拉德利;黄瑶;马西莫·马斯卡洛;贾尼斯·I·印托尼;肖恩·迈克尔·欧康纳;以利沙·纳塔利·马罗格力;罗伯特·尼古拉斯·希尔顿 | 申请(专利权)人: | 弩锋股份有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L17/02;G10L25/90 |
代理公司: | 中国商标专利事务所有限公司11234 | 代理人: | 桑丽茹,曾海艳 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 确定 谐波 信号 特征 | ||
优先权要求
本申请基于并要求以下申请的优先权:2015年2月6日提交的题为“光谱运动变换”的美国临时专利申请No.62/112836;2015年2月6日提交的题为“音高速度评估”的美国临时专利申请No.62/112796;2015年2月6日提交的题为“峰值区间音高估计”的美国临时专利申请62/112832;2015年2月6日提交的题为“来自对称特征的音高”的美国临时专利申请62/112850和2015年12月15日提交的题为“确定谐波信号的特征”的美国非临时专利申请14/969029;2015年12月15日提交的题为“使用对称特征估计音高”的美国非临时专利申请14/969022;2015年12月15日提交的题为“利用多个频率表示估计分数啁啾率”的美国非临时专利申请14/969036;2015年12月15日提交的题为“利用峰到峰距离估计音高”的美国非临时专利申请14/969038,其内容通过引用整体并入本文。
背景技术
谐波信号可以具有基频和一个或多个泛音。谐波信号包括例如语音和音乐。谐波信号可以具有基频,其可以被称为第一谐波。谐波信号可以包括可能在第一谐波的倍数处发生的其它谐波。例如,如果在一定时间基频为f,则其它谐波的频率可以为2f,3f等。
谐波信号的基频可随时间而改变。例如,当一个人在说话时,语音的基频可能在问题结束时增加。信号频率的变化可以被称为啁啾率。谐波信号的啁啾率对于不同的谐波可能是不同的。例如,如果第一谐波具有啁啾率c,则其它谐波可以具有2c,3c等的啁啾率。
在诸如语音识别,信号重建和说话者识别等应用中,可能需要确定谐波信号随时间的特性。例如,可能需要确定信号的音高,音高随时间的变化率,或频率,啁啾率或不同谐波的振幅。
发明内容
在一个实施方式中,发明特征可以包括:
1、一种用于估计音高的计算机实现的方法,所述方法包括:
获得信号的第一部分的频率表示;
获得所述信号的第一部分的第一音高估计;
使用所述第一音高估计来识别所述频率表示的多个频率部分,所述多个频率部分包括第一频率部分和第二频率部分;
使用所述多个频率部分来计算多个相关性,所述多个相关性包括所述第一频率部分和所述第二频率部分之间的第一相关性;
使用所述多个相关性来计算第一得分;和
使用所述第一得分计算第二音高估计。
2、根据条款1所述的方法,其中所述多个相关性还包括(i)所述第一频率部分与所述第二频率部分的反转版本之间的第二相关性,以及(ii)所述第一频率部分和所述第一频率部分的反转版本之间的第三相关性。
3、根据条款1所述的方法,其中所述多个频率部分分割所述频率表示。
4、根据条款1所述的方法,其中计算所述第一得分包括计算所述多个相关性中的每个相关性的似然度或对数似然度。
5、根据条款1所述的方法,其中计算所述第二音高估计包括使用所述第一得分执行黄金分割搜索或梯度下降。
6、根据条款1所述的方法,其中所述多个频率部分中的每个频率部分以所述第一音高的倍数为中心。
7、根据条款1所述的方法,还包括在计算所述多个相关性之前对所述多个频率部分中的每个频率部分进行归一化。
8、根据条款1所述的方法,还包括使用所述第二音高估计来执行语音识别,说话人验证,说话人识别或信号重建中的至少一个。
9、一种用于估计谐波信号的特征的系统,所述系统包括一个或多个计算设备,所述一个或多个计算设备包括至少一个处理器和至少一个存储器,所述一个或多个计算设备被配置为:
获得信号的第一部分的频率表示;
获得所述信号的第一部分的第一音高估计;
使用所述第一音高估计来识别所述频率表示的多个频率部分,所述多个频率部分包括第一频率部分和第二频率部分;
使用所述多个频率部分来计算多个相关性,所述多个相关性包括所述第一频率部分和所述第二频率部分之间的第一相关性;
使用所述多个相关性来计算第一得分;和
使用所述第一得分计算第二音高估计。
10、根据条款1所述的系统,其中所述多个相关性还包括(i)所述第一频率部分与所述第二频率部分的反转版本之间的第二相关性,以及(ii)所述第一频率部分和所述第一频率部分的反转版本之间的第三相关性。
11、根据条款1所述的系统,其中所述多个频率部分分割所述频率表示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于弩锋股份有限公司,未经弩锋股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201680017664.6/2.html,转载请声明来源钻瓜专利网。