[发明专利]解码方法、语音识别设备和系统在审
申请号: | 201910846620.X | 申请日: | 2019-09-09 |
公开(公告)号: | CN111192576A | 公开(公告)日: | 2020-05-22 |
发明(设计)人: | 李敏重 | 申请(专利权)人: | 三星电子株式会社 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L25/30;G06N3/08 |
代理公司: | 北京铭硕知识产权代理有限公司 11286 | 代理人: | 王兆赓;刘灿强 |
地址: | 韩国京畿*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 解码 方法 语音 识别 设备 系统 | ||
提供解码方法、语音识别设备和系统。所述方法基于至少一个先前输入词法单元预测输出词法单元的候选的概率;基于预测的概率在候选中确定输出词法单元;并且通过基于确定的输出词法单元的概率选择输出词法单元和预定义的特殊词法单元中的一个来确定下一输入词法单元。
本申请要求于2018年11月14日提交到韩国知识产权局的第10-2018-0139787号韩国专利申请的权益,所述韩国专利申请的全部公开出于所有目的通过引用包含于此。
技术领域
本申请涉及语音识别的方法和设备。
背景技术
当接收具有未定义长度的序列作为人工神经网络中的输入时,会生成未定义长度的输出。通常,为了处理这个问题,可实现作为一种序列到序列模型的编码器-解码器人工神经网络模型。例如,一种基于神经网络的先前输出作为输入,针对与构成一个序列的单元对应的每个词法单元连续输出后续的输出,以便使用人工神经网络计算具有未定义长度的输出的方法可被称为自回归解码。
发明内容
提供本发明内容,以简化的形式介绍下面在具体实施方式中进一步描述的构思的选择。本发明内容不意在确定要求权利的主题的关键特征或必要特征,也不意在用于帮助确定要求权利的主题的范围。
在一个总体方面,一种第一神经网络中的处理器实现的解码方法包括:基于至少一个先前输入词法单元预测输出词法单元的候选的概率;基于预测的概率在候选中确定输出词法单元;以及通过基于确定的输出词法单元的概率来选择输出词法单元和预定义的特殊词法单元中的一个来确定下一输入词法单元。
特殊词法单元可被确定为下一输入词法单元,基于特殊词法单元预测的下一输出词法单元的候选的可靠性高于基于输出词法单元预测的下一输出词法单元的候选的可靠性。
确定输出词法单元的步骤可包括:基于由与第一人工神经网络交互工作的一个或多个第二神经网络预测的候选的概率与由第一人工神经网络预测的候选的概率的组合,从候选选择输出词法单元。
神经网络的输入层可包括与每个候选对应的多个节点和与特殊词法单元对应的特殊节点。
所述至少一个先前输入词法单元可包括由神经网络先前预测的输出词法单元和特殊词法单元中的至少一个。
确定输出词法单元的步骤可包括选择候选中具有最高概率的词法单元。
所述方法可以是使用第一神经网络和所述一个或多个第二神经网络的识别方法。
确定下一输入词法单元的步骤可包括:将输出词法单元的概率与阈值概率进行比较;当输出词法单元的概率低于所述阈值概率时,选择特殊词法单元作为下一输入词法单元;当输出词法单元的概率高于或等于所述阈值概率时,选择输出词法单元作为下一输入词法单元。
预测输出词法单元的候选的概率的步骤可包括:基于所述至少一个先前输入词法单元与输出词法单元之间的关系来预测输出词法单元的候选的概率。
所述方法还可包括:基于所述至少一个先前输入词法单元和下一输入词法单元确定下一输出词法单元。
所述方法还可包括:屏蔽特殊词法单元以防止除了特殊词法单元以外的词法单元注意到特殊词法单元。
所述方法还可包括:当特殊词法单元被确定为下一输入词法单元时,将下一输出词法单元与特殊词法单元之间的关系设置为小于或等于预定值。
确定输出词法单元的步骤可包括:确定输出词法单元是否与特殊词法单元相似;以及当输出词法单元与特殊词法单元相似时,将候选中具有第二最高概率的词法单元确定为输出词法单元。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三星电子株式会社,未经三星电子株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910846620.X/2.html,转载请声明来源钻瓜专利网。