[发明专利]语音质量评价设备、方法和系统有效
申请号: | 201410736334.5 | 申请日: | 2014-12-04 |
公开(公告)号: | CN104485116B | 公开(公告)日: | 2019-05-14 |
发明(设计)人: | 林晖 | 申请(专利权)人: | 上海流利说信息技术有限公司 |
主分类号: | G10L25/60 | 分类号: | G10L25/60 |
代理公司: | 北京思睿峰知识产权代理有限公司 11396 | 代理人: | 谢建云;董宁 |
地址: | 200433 上海市杨*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 质量 评价 设备 方法 系统 | ||
1.一种基于重音的语音质量评价设备,包括:
存储单元,适于存储预定文本和所述预定文本对应的参考重音特征,该预定文本包括一个或者多个语句,且每个语句包括一个或者多个词;
用户语音接收单元,适于接收用户针对预定文本所录入的用户语音;
特征获取单元,适于获取所述用户语音的用户重音特征,所述特征获取单元包括:
对齐子单元,适于利用预定声学模型将所述用户语音与所述预定文本进行强制对齐,以确定所述预定文本中的每个词和/或每个词中的每个音节和/或每个音节的每个音素与所述用户语音的部分之间的对应关系;以及
特征计算子单元,适于基于所述对应关系计算所述用户语音的用户重音特征;以及
语音质量计算单元,适于基于所述参考重音特征与所述用户重音特征之间的相关性,计算所述用户语音的语音质量,所述相关性包括相似度或距离,所述参考重音特征与所述用户重音特征的获取方式相同。
2.根据权利要求1所述的语音质量评价设备,其中,所述特征计算子单元适于:
针对所述预定文本的每个语句:
基于所述对应关系,获取每个词和/或每个词中的每个音节在所述用户语音中所对应的语音块的特征参数;以及
利用经过训练的预定专家模型以及每个语音块的特征参数,获得每个语音块的重读属性;以及
基于所获得的各语句的各词和/或各词中的各个音节对应的语音块的重读属性,形成所述用户语音的重音特征。
3.根据权利要求2所述的语音质量评价设备,其中,每个语音块包括一段声波,且该语音块的特征参数包括以下参数中的至少一种:
该语音块对应声波波形的波峰和波谷;
该语音块对应声波波形的波峰和波谷的绝对值以及波形的能量值;
该语音块的持续时长或该语音块的归一化的持续时长;
从该语音块中获得的音调信息的平均值;
对从该语音块中获得的音调信息进行差分而得到的差分值的平均值;以及
通过将从该语音块中获得的音调信息的形状和预定义的多个音调模型进行关联度计算而得到的多个关联值。
4.根据权利要求1所述的语音质量评价设备,还包括:
输出单元,适于可视化输出所述语音质量的计算结果。
5.根据权利要求4所述的语音质量评价设备,其中,所述输出单元适于输出如下结果来作为所述语音质量的计算结果:
反映所述语音质量的分数;和/或
所述用户重音特征和所述参考重音特征之间的差别。
6.根据权利要求1所述的语音质量评价设备,其中:
所述存储单元适于从预定服务器预先下载所述预定文本和所述参考重音特征以保存;或
所述存储单元适于从预定服务器预先下载所述预定文本以及至少一段参考语音的特征参数,并根据所述至少一段参考语音的特征参数计算获得所述参考重音特征以保存。
7.一种基于重音的语音质量评价方法,包括如下步骤:
接收用户针对预定文本所录入的用户语音,该预定文本包括一个或者多个语句,且每个语句包括一个或者多个词;
获取所述用户语音的用户重音特征,包括:
利用预定声学模型将所述用户语音与所述预定文本进行强制对齐,以确定所述预定文本中的每个词和/或每个词中的每个音节和/或每个音节的每个音素与所述用户语音的部分之间的对应关系,并基于所述对应关系获得所述用户语音的用户重音特征;以及
基于所述预定文本对应的参考重音特征与所述用户重音特征之间的相关性,计算所述用户语音的语音质量,所述相关性包括相似度或距离,所述参考重音特征与所述用户重音特征的获取方式相同。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海流利说信息技术有限公司,未经上海流利说信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410736334.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于语音活动检测的检测器和方法
- 下一篇:一种降噪吸声层