[发明专利]说话人标准化方法及用该方法的语音识别装置有效
申请号: | 03160348.3 | 申请日: | 2003-09-24 |
公开(公告)号: | CN1494053A | 公开(公告)日: | 2004-05-05 |
发明(设计)人: | 森井景子;中藤良久;桑野裕康 | 申请(专利权)人: | 松下电器产业株式会社 |
主分类号: | G10L15/00 | 分类号: | G10L15/00 |
代理公司: | 上海专利商标事务所 | 代理人: | 包于俊 |
地址: | 日本国大*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 将输入语音切分为一定时间长度作为帧,抽取每帧的音响特征量,利用预先规定的多个频率变换系数将所述音响特征量进行频率变换。利用通过频率变换得到的多个变换后特征量及至少1个标准音韵模型的全部组合,计算每帧的变换后特征量与标准音韵模型的多个类似度或距离,利用该多个类似度或距离,决定使输入语音标准化用的频率变换条件,利用决定的频率变换条件使输入语音标准化。根据该方法,即使发出语音的说话人调换,也能够补偿输入语音的个人差别,提高语音识别性能。 | ||
搜索关键词: | 说话 标准化 方法 语音 识别 装置 | ||
【主权项】:
1.一种说话人标准化方法,其特征在于,包含将输入语音切分为一定时间长度作为帧、并提取所述每帧的音响特征量的特征量提取步骤;对所述音响特征量用预先规定的各个频率变换系数进行频率变换的频率变换步骤;利用由所述频率变换得到的多个变换后特征量与至少一个标准音韵模型的全部组合、计算所述每帧的变换后特征量与标准音韵模型的多个类似度或距离的步骤;利用所述多个类似度或距离、决定使所述输入语音标准化用的频率变换条件的步骤;以及利用所述频率变换条件使所述输入语音标准化的步骤。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于松下电器产业株式会社,未经松下电器产业株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/03160348.3/,转载请声明来源钻瓜专利网。