[发明专利]一种音调序列的鲁棒阶跃规整方法有效

申请号：	201610231868.1	申请日：	2016-04-14
公开（公告）号：	CN105741857B	公开（公告）日：	2019-06-14
发明（设计）人：	李玉鑑;时康凯;杨红丽	申请（专利权）人：	北京工业大学
主分类号：	G10L25/90	分类号：	G10L25/90;G10L25/03;G10L25/54
代理公司：	北京思海天达知识产权代理有限公司 11203	代理人：	沈波
地址：	100124 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	一种音调序列的鲁棒阶跃规整方法，用于将不准确的音调值规整到更符合上下文的音调值上，在音调值的确定上有很好的效果。具体过程包括：首选对输入音频数字信号提取原始音调序列，然后反复截取长度固定的子音调序列，并映射到规整矩阵中，其次扩展该规整矩阵，构造相应的图结构，求解其中的路径以生成路径关联矩阵，最后通过分析路径关联矩阵找到符合上下文的音调值作为音调校准值。本发明对音调序列规整的目标结果符合实际情况，对声音音调值的提取也更加准确可靠；对音调序列规整的过程可控，通过自行设定相关参数可以让规整的过程更加灵活；在音调序列值分散较大的情况仍然会有很好的效果，具备很好的鲁棒性。
搜索关键词：	一种音调序列阶跃规整方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种音调序列的鲁棒阶跃规整方法，其特征在于：本方法包括以下步骤：S1对输入长度为t的音频数字信号x₁,x₂,…,x_t提取原始音调序列：a)设置数字信号的帧长度为L，把信号划分为个不重叠的数据帧；b)对每一帧音频信号，利用短时平均幅度差函数或短时自相关函数或加权短时自相关函数方法计算出与原始音频信号波形具有相同周期的中间函数波形；c)提取中间函数波形的极值点序列K₁,K₂,…,K_u，及相应的位置点序列P₁,P₂,…,P_u，u为极值点个数兼位置点个数；d)利用极值点序列计算中间函数波形的频率f，设定n的初值为2，具体步骤如下：i.按顺序取第1到n个极值点构成极值向量a，取第n+1到2·n个极值点构成极值向量b；ii.利用公式计算a，b之间的余弦相似度；iii.把n增加2，重复步骤i到iii直到n大于u/2；iv.把sim₂,sim₄,…,sim_n从大到小排列，取出所有sim_n大于Δ的n值，求这些n值两两之间的最大公约数d，取出现次数最多的公约数D，作为波形信号每个周期中最可能包含的极值点个数；v.根据公约数D、极值点序列K₁,K₂,…,K_u和位置点序列P₁,P₂,…,P_u，从P₁开始计算包含D个极值点的时间区间，作为周期值period，并计算出频率f＝1/period；e)利用频率值f和公式Semitone＝log₂(f/440)*12+69计算每一帧信号的音调值；f)将所有计算得到的音调值记为T₁,T₂,…,T_s，该序列就是原始音调序列；S2设置音调持续的最短时间阈值H；利用音频采样率Q，计算该时间阈值内音调值的个数N，具体计算公式是：S3输入需要校准规整的音调序列T₁,T₂,…,T_s，设置移位偏移量i初值为N+1；S4构造一个(2·N+1)×(2·N+1)的规整矩阵M，具体步骤如下：g)在T₁,T₂,…,T_s中以T_i为中心截取T_i及左右两边各N个音调值，组成序列S₁,S₂,…,S_2·N+1，并置规整矩阵M为全0矩阵；h)找到S₁,S₂,…,S_2·N+1的最大值MAX与最小值MIN；i)计算以及第row行的参考值SCALE_row＝MAX‑(row‑1)·λ，row＝1,2,…,2·N+1；j)对每一个元素S_c，c＝1,2,…,2·N+1，找到和S_m最接近的参考值SCALE_r，令M的第r行第c列元素值为1，即M_r,c＝1；S5利用规整矩阵M构造两个与之完全相同的矩阵EM，XM；用EM_p,q代表矩阵EM第p行第q列的元素，用XM_p,q代表矩阵XM第p行第q列的元素；S6对EM进行扩展操作：对任意XM_p,q，当XM_p,q为1时，令EM_p,q‑1和EM_p,q+1为1；S7将矩阵EM转换成无向图G＝<V,E>，具体步骤如下：k)无向图G的顶点集V由EM中EM_p,q＝1的元素构成；l)无向图G的边集E由所有EM_p,q＝1和EM_p‑1,q＝1的顶点对，EM_p,q＝1和EM_p+1,q的顶点对，以及EM_p,q＝1和EM_p,q+1的顶点对构成；m)把图G的顶点集分为2·N+1层，第q层记作Y_q，由EM中所有EM_p,q＝1的元素构成；S8在图G中求解由第1层到2·N+1层的路径：若路径不存在，则需要将矩阵EM值赋给矩阵XM，并跳转到S6执行；若路径存在，则对规整矩阵M构造路径关联集合PS，具体构造步骤如下：n)在图G中找到包含该路径的连通分支PC；o)对连通分支PC中的任意元素EM_p,q，如果M_p,q＝1，则将M_p,q添加到集合PS中；S9统计PS中每一个元素M_p,q的p值，取出现次数最多的p值记为R，当多个p值出现次数均为最多时，R取最小的p值；把和第R行的参考值SCALE_R相差最小的音调值S_j作为当前音调值T_i的校准值，记作TW_i＝S_j；S10把i值增加1，当i<L‑N时，重复S4～S9，直到把输入的音调序列每个值都规整完毕；S11将音调校准值序列TW₁,TW₂,…,TW_s赋给T₁,T₂,…,T_s。S12循环执行S3～S11共N次，最终得到的输出值序列T₁,T₂,…,T_s即为最终的校准值序列；1>Δ>0.80；0.01秒<H<1.00秒。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京工业大学，未经北京工业大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201610231868.1/，转载请声明来源钻瓜专利网。

上一篇：一种三轮车专用防盗锁
下一篇：一种基于音频分析的乘务员呼唤应答检测方法

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种音调序列的鲁棒阶跃规整方法有效

专利文献下载