[发明专利]语音识别方法和设备在审
申请号: | 201711372384.X | 申请日: | 2017-12-19 |
公开(公告)号: | CN108364651A | 公开(公告)日: | 2018-08-03 |
发明(设计)人: | 文珉暎;李镐式;崔荣相 | 申请(专利权)人: | 三星电子株式会社 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/08;G10L15/183 |
代理公司: | 北京铭硕知识产权代理有限公司 11286 | 代理人: | 张川绪;王兆赓 |
地址: | 韩国京畿*** | 国省代码: | 韩国;KR |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音识别 方法和设备 候选文本 解码条件 目标文本数据 解码 语音信号 讲话 | ||
1.一种语音识别方法,包括:
从用户的语音信号产生多条候选文本数据;
确定与用户的讲话类型对应的解码条件;
通过基于确定的解码条件执行解码,在所述多条候选文本数据之中确定目标文本数据。
2.根据权利要求1所述的语音识别方法,还包括:基于语音信号的特征、上下文信息、以及来自语音信号的识别部分的语音识别结果中的任意一个或者任意两个或更多个的任意组合,确定讲话类型。
3.根据权利要求2所述的语音识别方法,其中,上下文信息包括用户位置信息、用户配置文件信息以及在用户装置中执行的应用的应用类型信息中的任意一个或者任意两个或更多个的任意组合。
4.根据权利要求1所述的语音识别方法,其中,确定解码条件的步骤包括:响应于讲话类型被确定,从映射信息选择映射到确定的讲话类型的解码条件,其中,映射信息包括多个讲话类型和分别映射到所述多个讲话类型的相应的多个解码条件。
5.根据权利要求1所述的语音识别方法,其中,确定目标文本数据的步骤包括:
将当前解码条件改变为确定的解码条件;
基于确定的解码条件计算所述多条候选文本数据中的每个的概率;
基于计算的多个概率,在所述多条候选文本数据之中确定目标文本数据。
6.根据权利要求1所述的语音识别方法,其中,确定目标文本数据的步骤包括:
基于确定的解码条件,调节声学模型的权重和语言模型的权重中的任何一个或两者;
通过基于声学模型的权重和语言模型的权重中的任何一个或两者执行解码,来确定目标文本数据。
7.根据权利要求1所述的语音识别方法,其中,产生多条候选文本数据的步骤包括:
基于声学模型从语音信号确定音素序列;
基于语言模型从确定的音素序列识别多个单词;
基于识别的多个单词产生所述多条候选文本数据。
8.根据权利要求7所述的语音识别方法,其中,声学模型包括被配置为基于语音信号的特征确定讲话类型的分类器。
9.根据权利要求1所述的语音识别方法,其中,解码条件包括:声学模型的权重、语言模型的权重、与对音标分布的依赖性关联的比例因子、倒谱均值和方差标准化、以及解码窗口大小中的任意一个或者任意两个或更多个的任意组合。
10.一种存储指令的非暂时性计算机可读介质,当由处理器执行所述指令时,使处理器执行权利要求1的语音识别方法。
11.一种语音识别设备,包括:
处理器;
存储器,被配置为存储可被处理器执行的指令;
其中,响应于执行所述指令,处理器被配置为:
从用户的语音信号产生多条候选文本数据;
确定与用户的讲话类型对应的解码条件;
通过基于确定的解码条件执行解码,在所述多条候选文本数据之中确定目标文本数据。
12.根据权利要求11所述的语音识别设备,其中,处理器还被配置为:基于语音信号的特征、上下文信息、以及来自语音信号的识别部分的语音识别结果中的任意一个或者任意两个或更多个的任意组合,确定讲话类型。
13.根据权利要求12所述的语音识别设备,其中,上下文信息包括用户位置信息、用户配置文件信息以及在用户装置中执行的应用的应用类型信息中的任意一个或者任意两个或更多个的任意组合。
14.根据权利要求11所述的语音识别设备,其中,处理器还被配置为:响应于讲话类型被确定,从映射信息选择映射到确定的讲话类型的解码条件,其中,映射信息包括多个讲话类型和分别映射到所述多个讲话类型的相应的多个解码条件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三星电子株式会社,未经三星电子株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711372384.X/1.html,转载请声明来源钻瓜专利网。