[发明专利]用于改善非母语者语音的语音识别的方法有效
申请号: | 201680062312.2 | 申请日: | 2016-09-22 |
公开(公告)号: | CN108352127B | 公开(公告)日: | 2020-03-10 |
发明(设计)人: | 格雷戈里·卡萨尼;菲利普·沙普茨尼科 | 申请(专利权)人: | 旺多姆咨询私人有限公司 |
主分类号: | G09B19/06 | 分类号: | G09B19/06;G09B5/04;G06N20/00;G06F40/40 |
代理公司: | 深圳市博锐专利事务所 44275 | 代理人: | 张明 |
地址: | 澳大利亚新南威尔*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 改善 母语 语音 识别 方法 | ||
用于为分布式语言学习系统的用户自动生成语音样本资产生产得分的方法、自动口音识别和量化以及改进的语音识别。使用经训练的监督机器学习模块,该监督机器学习模块使用训练集被训练,该训练集包括多个生产语音样本资产记录、由执行感知练习的系统用户生成的相关联的生产得分、以及用户背景信息。经训练的监督机器学习模块可以被配置用于通过馈送候选生产语音样本资产以使语音样本资产生产得分和用户背景信息的生成自动化来实现自动口音识别。这样,用户背景信息可以被转换为口音类型类别,并且语音样本资产生产得分可以被转换为口音强度。在另外的实施例中,使用经训练的系统生成的口音类型类别可以用于改进的语音识别。
技术领域
本发明涉及用于为分布式语言学习系统的用户自动生成语音样本资产生产得分的方法、自动口音识别和量化以及改进的语音识别。
发明内容
在本文中提供的实施例中,提供了一种用于为分布式语言学习系统的用户自动生成语音样本资产生产得分的方法。具体地,该方法可以使用经训练的监督机器学习模块,该监督机器学习模块使用训练集被训练,该训练集包括多个生产语音样本资产记录、由执行感知练习的系统用户生成的相关联的生产得分、以及用户背景信息。
一旦被训练,经训练的监督机器学习模块就可以被配置为在被提供候选生产语音样本资产记录和用户背景信息时使语音样本资产生产得分的生成自动化。
在另外的实施例中,经训练的监督机器学习模块可以被配置用于自动化口音识别。具体地,经训练的监督机器学习模块可以被馈送候选生产语音样本资产以使语音样本资产生产得分和用户背景信息的生成自动化。
这样,用户背景信息可以被转换为口音类型类别,并且语音样本资产生产得分可以被转换为口音强度。
在另外的实施例中,使用经训练的系统生成的口音类型类别可以用于改进的语音识别,其中口音类型类别用于为语音识别模块选择适当的声学模型的目的。
因此,考虑到前述内容,根据第一方面,提供了一种用于为分布式语言学习系统的用户自动生成语音样本资产生产得分的方法,该方法包括:对于包括本地语音样本资产的多个语音样本资产,向多个非母语用户发送本地语音样本资产以执行生产练习;接收由生产练习生成的生产语音样本资产;向多个用户发送生产语音样本资产以执行感知练习;接收由感知练习生成的生产得分;训练监督机器学习模块,包括:生成训练集,训练集包括第一多个非母语用户的生产语音样本资产以及相关联的生产得分和相关联的用户背景信息;使用所述训练集训练监督机器学习模块以生成经训练的监督机器学习模块;以及对于非母语用户的候选生产语音样本资产,将非母语用户的候选生产语音样本资产和用户背景信息输入到经训练的监督机器学习模块中,以使候选生产语音样本资产的语音样本资产生产得分的生成自动化。
该方法还可以包括扩展生产得分以降低评级漂移。
该方法还可以包括根据生产得分计算感知得分。
感知得分表示准确性。
感知得分表示一致性。
生产练习可以包括模仿生产练习。
模仿生产练习可以包括单词模仿生产练习。
模仿生产练习可以包括句子模仿生产练习。
生产练习可以包括理解练习。
感知练习可以包括根据反馈标度对记录的语音样本进行评级。
反馈标度可以是数字评级标度。
反馈标度可以是分类评级标度。
生产得分可以包括与多个度量相关的生产得分。
感知练习可以包括将生产语音样本资产与其他语音样本资产相比较。
计算感知得分可以包括将生产得分与用户的生产语音样本资产的至少一个其他生产得分相比较。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于旺多姆咨询私人有限公司,未经旺多姆咨询私人有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201680062312.2/2.html,转载请声明来源钻瓜专利网。