[发明专利]一种发音检测方法及装置有效
申请号: | 201410692378.2 | 申请日: | 2014-11-25 |
公开(公告)号: | CN105609114B | 公开(公告)日: | 2019-11-15 |
发明(设计)人: | 高前勇;魏思;胡国平;胡郁;刘庆峰 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G10L25/03 | 分类号: | G10L25/03;G10L25/78 |
代理公司: | 11252 北京维澳专利代理有限公司 | 代理人: | 王立民;吴兰柱<国际申请>=<国际公布> |
地址: | 230088安徽省*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 发音 检测 方法 装置 | ||
1.一种发音检测方法,其特征在于,包括:
接收待检测语音信号;
确定所述语音信号的各基本语音单元及所述基本语音单元对应的语音帧及帧数;
计算将所述基本语音单元规整到预设的固定帧数时所需的可变帧移;
根据所述可变帧移及预设的固定帧长,对规整后的基本语音单元进行分帧;
提取分帧后的基本语音单元的音段特征;
计算所述基本语音单元的音段特征与预设的对应所述基本语音单元的标准发音模型的似然度,所述预设的对应所述基本语音单元的标准发音模型是预先在训练集上提取基本语音单元的声学特征后训练数学统计模型得到的;
根据所述似然度确定所述基本语音单元的发音是否正确。
2.根据权利要求1所述的方法,其特征在于,所述计算将所述基本语音单元规整到预设的固定帧数时所需的可变帧移包括:
计算第一差值与第二差值的比值,所述第一差值为所述基本语音单元对应的语音帧的帧数与1的差值,所述第二差值为所述固定帧数与1的差值;
将所述第一差值与第二差值的比值与规整前所述基本语音单元对应的语音帧的帧移的乘积作为所述可变帧移。
3.根据权利要求1所述的方法,其特征在于,在所述计算将所述基本语音单元规整到预设的固定帧数时所需的可变帧移之前,还包括:
根据所述基本语音单元的类型确定所述基本语音单元对应的固定帧数。
4.根据权利要求1所述的方法,其特征在于,所述提取分帧后的基本语音单元的音段特征包括:
提取分帧后的基本语音单元对应的各语音帧的声学特征;
依次拼接所述语音单元内所述各语音帧的声学特征得到所述基本单元的音段特征。
5.根据权利要求1至4任一项所述的方法,其特征在于,所述根据所述似然度确定所述基本语音单元的发音是否正确包括:
如果所述似然度大于设定的似然度阈值,则确定所述基本语音单元发音正确;
否则,确定所述基本语音单元发音错误。
6.根据权利要求1至4任一项所述的方法,其特征在于,所述根据所述似然度确定所述基本语音单元的发音是否正确包括:
根据所述似然度计算所述基本语音单元的发音后验概率;
如果所述发音后验概率大于设定的概率阈值,则确定所述基本语音单元发音正确;
否则,确定所述基本语音单元发音错误。
7.一种发音检测装置,其特征在于,包括:
信号接收单元,用于接收待检测语音信号;
确定单元,用于确定所述语音信号的各基本语音单元及所述基本语音单元对应的语音帧及帧数;
可变帧移计算单元,用于计算将所述基本语音单元规整到预设的固定帧数时所需的可变帧移;
分帧单元,用于根据所述可变帧移及预设的固定帧长,对规整后的基本语音单元进行分帧;
音段特征提取单元,用于提取分帧后的基本语音单元的音段特征;
似然度计算单元,用于计算所述基本语音单元的音段特征与预设的对应所述基本语音单元的标准发音模型的似然度,所述预设的对应所述基本语音单元的标准发音模型是预先在训练集上提取基本语音单元的声学特征后训练数学统计模型得到的;
检测单元,用于根据所述似然度确定所述基本语音单元的发音是否正确。
8.根据权利要求7所述的装置,其特征在于,
所述可变帧移计算单元,具体用于计算第一差值与第二差值的比值,所述第一差值为所述基本语音单元对应的语音帧的帧数与1的差值,所述第二差值为所述固定帧数与1的差值;并将所述第一差值与第二差值的比值与规整前所述基本语音单元对应的语音帧的帧移的乘积作为所述可变帧移。
9.根据权利要求7所述的装置,其特征在于,所述装置还包括:
固定帧数确定单元,用于根据所述基本语音单元的类型确定所述基本语音单元对应的固定帧数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410692378.2/1.html,转载请声明来源钻瓜专利网。