[发明专利]对语音识别模型进行个性化的装置和方法及电子装置在审
申请号: | 201811106697.5 | 申请日: | 2018-09-21 |
公开(公告)号: | CN110473526A | 公开(公告)日: | 2019-11-19 |
发明(设计)人: | 权奇秀;宋仁哲;崔荣相 | 申请(专利权)人: | 三星电子株式会社 |
主分类号: | G10L15/07 | 分类号: | G10L15/07 |
代理公司: | 11286 北京铭硕知识产权代理有限公司 | 代理人: | 姜长星;张川绪<国际申请>=<国际公布> |
地址: | 韩国京畿*** | 国省代码: | 韩国;KR |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音识别 个性化 方法和装置 电子装置 矩阵应用 语言 尺度 | ||
对语音识别模型进行个性化的装置和方法及电子装置。提供一种用于对语音识别模型进行个性化的方法和装置,其中,所述装置通过识别与用户对应的语言组并通过将与识别的语言组对应的组尺度矩阵应用到语音识别模型的至少一个层生成个性化的语音识别模型来对语音识别模型进行个性化。
本申请要求于2018年5月11日提交到韩国知识产权局的第10-2018-0054448号韩国专利申请的权益,所述韩国专利申请的全部公开出于所有目的通过引用包含于此。
技术领域
下面的描述涉及对语音识别模型进行个性化的技术。
背景技术
语音识别是一种将包括在语音输入中的语言信息转换成与语音输入对应的文本信息的处理。语音识别模型帮助语音识别。语音识别模型识别输入到装置的语音并输出语音识别结果。语音识别模型通过对语音输入进行分析来估计由包括在语音输入中的语言信息指示的文本信息。语音输入具有语音序列的形式。
发明内容
提供本发明内容来以简化的形式介绍在下面的具体实施方式中进一步描述的构思的选择。本发明内容不意在标识要求保护的主题的关键特征或必要特征,也不意在用于帮助确定要求保护的主题的范围。
在一个总体方面,提供一种用于对语音识别模型进行个性化的处理器实现的方法,所述方法包括:识别与用户对应的语言组;通过将与识别的语言组对应的组尺度矩阵应用到语音识别模型的一个或多个层来生成个性化的语音识别模型。
识别的步骤可包括:基于与用户相关联的用户输入、位置信息和语言特性估计信息中的任何一个或任何组合来识别用户的语言组。
识别的步骤可包括:识别与用户对应的语言组,生成的步骤可包括:将与所述语言组对应的组尺度矩阵应用到语音识别模型的所述一个或多个层。
应用所述组尺度矩阵的步骤可包括:基于所述语言组中的每个语言组的分层位置,将与所述语言组对应的所述组尺度矩阵顺序地应用到所述一个或多个层。
应用所述组尺度矩阵的步骤可包括:将与所述语言组中的第一部分对应的所述组尺度矩阵中的第一部分应用到所述一个或多个层;将与所述语言组中的第二部分对应的所述组尺度矩阵中的第二部分应用到语音识别模型的其他层。
生成的步骤可包括:通过将组尺度矩阵和用户尺度矩阵应用到所述一个或多个层来生成个性化的语音识别模型。
所述方法可包括:响应于从用户获得语音信号,基于语音信号来训练个性化的语音识别模型中的用户尺度矩阵;当训练用户尺度矩阵时,固定至少一个参数。
所述方法可包括:响应于个性化的语音识别模型的组尺度矩阵被改变,更新用户尺度矩阵。
所述方法可包括:将用户尺度矩阵的初始值设置为与组尺度矩阵的值相同。
生成的步骤可包括:通过将组尺度矩阵应用到所述一个或多个层中的节点的输出,来校正包括在所述一个或多个层中的节点的输出;将校正的输出转发给后续的层。
识别的步骤可包括:响应于当前用户不同于之前用户,识别与当前用户对应的语言组。
识别与当前用户对应的语言组的步骤可包括:加载关于之前用户所属的语言组的组尺度矩阵中的一部分,生成的步骤可包括:通过将所述组尺度矩阵的加载的一部分应用到语音识别模型来生成个性化的语音识别模型。
所述方法可包括:基于个性化的语音识别模型来识别用户的语音输入。
所述方法可包括:在生成个性化的语音识别模型之后,识别与用户对应的额外的语言组;通过将与额外的语言组对应的额外的组尺度矩阵应用到所述一个或多个层,来更新个性化的语音识别模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三星电子株式会社,未经三星电子株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811106697.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:获取语音训练样本的方法和装置
- 下一篇:一种语音识别的方法和系统