[发明专利]融合韵律信息的汉语方言辨识方法有效

专利信息
申请号: 201610131809.7 申请日: 2016-03-08
公开(公告)号: CN105810191B 公开(公告)日: 2019-11-29
发明(设计)人: 夏玉果;顾明亮 申请(专利权)人: 江苏信息职业技术学院
主分类号: G10L15/02 分类号: G10L15/02;G10L15/18
代理公司: 32263 无锡万里知识产权代理事务所(特殊普通合伙) 代理人: 王传林<国际申请>=<国际公布>=<进入
地址: 214153 *** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要: 本申请公开了一种融合韵律信息的汉语方言辨识方法,包括:s1、输入汉语方言信号进行语音信号提取,提取信号包括声学特征和韵律特征,所述声学特征包括SDC特征,所述韵律特征包括基频特征、能量包络特征和时长特征;s2、将提取的不同质的特征经过模型建模,转化成具有统一度量标准的特征矢量,然后进行组合构成一个统一矢量送分类器决策。本发明融合韵律信息的模型方法增加了汉语方言间的区别性,大大提升了方言辨识的正确率。
搜索关键词: 融合 韵律 信息 汉语 方言 辨识 方法
【主权项】:
1.一种融合韵律信息的汉语方言辨识方法,其特征在于,包括:/ns1、输入汉语方言信号进行语音信号提取,提取信号包括声学特征和韵律特征,所述声学特征包括SDC特征,所述韵律特征包括基频特征、能量包络特征和时长特征;/ns2、将提取的不同质的特征经过模型建模,转化成具有统一度量标准的特征矢量,然后进行组合构成一个统一矢量送分类器决策,所述SDC特征的计算由4个整型参数决定,即(N,d,P,k),其中N是每帧中倒谱特征的维数,d是计算差分倒谱的差分时间,P是k个倒谱块之间的转移时间,k是构成一个SDC特征的倒谱块的个数,在t帧第j个SDC特征的计算公式是:Δcj,t=cj,(t+d)-cj,(t-d)cj,t在t帧的第j个MFFCC特征参数,所以在t帧时SDC的特征可表示为:/n /n每帧SDC特征向量的维数为N×k维,所述基频特征中,基音频率包含在语音信号的浊音段中,浊音信号的每一帧写成:/n /n其中,n=0,…,N-1,N是每一帧语音的样本点数,I是拟合的谐波数,αi,ωi分别是描述第i个谐波的幅度、频率和相位,该信号x(n)的自相关为:/n /n其中,τ=0,…,N-1,定义相邻两帧信号的自相关协方差为该帧语音的基频流特征:/n /n其中,μt(τ)=E{Rt(τ)},d∈(N/2,N/2]是特征矢量的下标,令:/n /n其中,δi=ωt,it+1,i,Δ={δi,i=1,…,I},通过求导得到,/n /n假设分帧后的语音信号为相邻两帧语音信号记为:xt(n),xt+1(n),n=0,1,…N-1。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏信息职业技术学院,未经江苏信息职业技术学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201610131809.7/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top