[发明专利]语音识别方法和设备在审
申请号: | 201910953821.X | 申请日: | 2019-10-09 |
公开(公告)号: | CN111081230A | 公开(公告)日: | 2020-04-28 |
发明(设计)人: | 柳尚贤;友华·本吉奥;宋仁哲 | 申请(专利权)人: | 三星电子株式会社;蒙特利尔大学 |
主分类号: | G10L15/16 | 分类号: | G10L15/16;G10L15/06;G06N3/08;G06N3/04 |
代理公司: | 北京铭硕知识产权代理有限公司 11286 | 代理人: | 史泉;张川绪 |
地址: | 韩国京畿*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 方法 设备 | ||
公开一种语音识别方法和设备。所述语音识别方法包括:获得语音信号,以及执行语音信号的识别,其中,执行语音信号的识别的步骤包括:使用参数生成模型从输入方言数据生成针对语音信号的方言参数;将方言参数应用于训练的语音识别模型以生成方言语音识别模型,以及通过针对语音信号实施方言参数识别模型从语音信号生成语音识别结果。语音识别方法和设备可执行语音识别模型和参数生成模型的语音识别和/或训练。
本申请要求于2018年10月19日提交到韩国知识产权局的第10-2018-0125070号韩国专利申请的权益,所述韩国专利申请的全部公开出于所有目的通过引用包含于此。
技术领域
下面的描述涉及语音识别方法和设备。
背景技术
例如,诸如,在个人移动装置被配置为识别输入语音并输出识别的结果的地方,电子装置或相同可实施一个或多个语音识别模型以执行语音或音频识别。这种语音识别(即,机器语音识别)可以是将存在于输入语音中的语言信息转换为例如与输入语音对应的文本信息的处理。语音识别模型的实施可导致输入语音被分析,从而产生包括在输入语音中的语音信息的例如示例文本形式的估计。例如,到这样的语音识别模型的输入可以是语音序列的形式。
发明内容
提供本发明内容以简化的形式介绍在以下具体实施方式中进一步描述的构思的选择。本发明内容既不意在标识所要求保护的主题的关键特征或必要特征,也不意在用于帮助确定要求保护的主题的范围。
在一个总体方面,一种处理器实现的语音识别方法包括:获得语音信号,以及执行语音信号的识别,其中,执行语音信号的识别的步骤包括:使用参数生成模型从输入方言数据生成针对语音信号的方言参数;将方言参数应用于训练的语音识别模型以生成方言语音识别模型,以及通过针对语音信号实施方言语音识别模型,从语音信号生成语音识别结果。
应用方言参数的步骤可包括:将使用参数生成模型生成的方言参数或各自的方言参数应用于训练的语音识别模型的一个或多个层中的每个的至少各自的部分。
训练的语音识别模型可以是具有至少所述一个或多个层的神经网络模型,所述一个或多个层中的每个包括根据各自的加权连接连接到一个或多个层级上先前的层节点和/或一个或多个临时先前节点的至少一个节点,以及应用方言参数或各自的方言参数的步骤可包括:将连接权重插入到所述一个或多个层中的每个中,或者设置、替换或修改所述一个或多个层中的每个中的各自的连接权重,其中,所述一个或多个层的每个中的各自的连接权重少于所有的各自的加权连接。
方言参数或各自的方言参数还可包括一个或多个各自的缩放矩阵,应用方言参数或各自的方言参数的步骤还可包括:在方言语音识别模型的实施期间,将所述一个或多个各自的缩放矩阵应用于方言语音识别模型的一个或多个隐藏层的各自的输出。
方言参数或各自的方言参数还可包括一个或多个各自的批量参数,所述一个或多个各自的批量参数均可包括第一批量参数γ和第二批量参数β,以及应用方言参数或各自的方言参数的步骤还可包括:在方言语音识别模型的实施期间,通过针对方言语音识别模型的一个或多个隐藏层将各自的输入乘以第一批量参数γ并加上第二批量参数β并且将应用的一个或多个各自的批量参数的各自的结果分别转发到所述一个或多个隐藏层,将所述一个或多个各自的批量参数应用于所述一个或多个隐藏层的各自的输入。
各自的输入可以是归一化的各自的输入,并且各自的批量参数可以是各自的批量归一化参数。
方言参数或各自的方言参数还可包括一个或多个各自的批量参数,所述一个或多个各自的批量参数均可包括第一批量参数γ和第二批量参数β,以及应用方言参数或各自的方言参数的步骤还可包括:在方言语音识别模型的实施期间,通过针对方言语音识别模型的一个或多个隐藏层将各自的输入乘以第一批量参数γ并加上第二批量参数β并且将应用的一个或多个各自的批量参数的各自的结果分别转发到所述一个或多个隐藏层,将所述一个或多个各自的批量参数应用于所述一个或多个隐藏层的各自的输入。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三星电子株式会社;蒙特利尔大学,未经三星电子株式会社;蒙特利尔大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910953821.X/2.html,转载请声明来源钻瓜专利网。