[发明专利]语音识别方法及设备在审
申请号: | 202010064349.7 | 申请日: | 2020-01-20 |
公开(公告)号: | CN112331206A | 公开(公告)日: | 2021-02-05 |
发明(设计)人: | 李知炫 | 申请(专利权)人: | 三星电子株式会社 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/06;G10L15/08;G06F40/242;G06F40/154;G06F40/157;G06F40/117 |
代理公司: | 北京铭硕知识产权代理有限公司 11286 | 代理人: | 刘灿强;张川绪 |
地址: | 韩国京畿*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 方法 设备 | ||
1.一种语音识别方法,包括:
接收语音数据;
使用语音识别模型,从接收的语音数据获得候选文本,候选文本包括至少一个词和与包括在接收的语音数据中的目标词的发音相关联的语音符号序列;
用与语音符号序列对应的替换词来替换包括在候选文本中的语音符号序列;和
基于替换的结果来确定与接收的语音数据对应的目标文本。
2.根据权利要求1所述的语音识别方法,其中,所述至少一个词包括至少一个子词,并且
候选文本包括所述至少一个子词、语音符号序列、以及指示语音符号序列的开始和结束的标识符对。
3.根据权利要求2所述的语音识别方法,其中,替换的步骤包括:
用替换词来替换由标识符对标识的语音符号序列。
4.根据权利要求2所述的语音识别方法,其中,标识符对指示与语音符号序列相关联的目标词的类别。
5.根据权利要求1所述的语音识别方法,还包括:
使用包括与多个词和分别对应于所述多个词的语音符号序列有关的信息的词典数据,来确定与语音符号序列对应的替换词。
6.根据权利要求5所述的语音识别方法,还包括:
计算包括在候选文本中的语音符号序列与包括在词典数据中的语音符号序列中的每个之间的相似度;和
将与具有计算的包括在词典数据中的语音符号序列的相似度之中的最大相似度的语音符号序列对应的词确定为与包括在候选文本中的语音符号序列对应的替换词。
7.根据权利要求5所述的语音识别方法,其中,词典数据具有字典树或哈希图数据结构,并且
确定的步骤包括:
使用所述数据结构,从包括在词典数据中的语音符号序列检索与包括在候选文本中的语音符号序列对应的语音符号序列;和
将与检索的语音符号序列对应的词确定为与包括在候选文本中的语音符号序对应的替换词。
8.根据权利要求4所述的语音识别方法,还包括:
使用与不同类别对应的词典数据的集合之中的与由标识符对指示的类别对应的词典数据,确定与包括在候选文本中的语音符号序列对应的替换词;和
用确定的替换词来替换包括在候选文本中的语音符号序列,
其中,与不同类别对应的词典数据的集合包括与每个类别中的每个词所对应的语音符号序列有关的信息。
9.根据权利要求1所述的语音识别方法,还包括:
响应于语音符号序列对应于多个词,通过用所述多个词中的每个替换语音符号序列来获得多个候选目标文本;
使用语言模型来计算所述多个候选目标文本中的每个的分数;和
将具有计算的候选目标文本的分数之中的最大分数的候选目标文本确定为目标文本。
10.根据权利要求1所述的语音识别方法,其中,语音符号序列与对应于专有名词的目标词的发音相关联。
11.根据权利要求1所述的语音识别方法,其中,语音识别模型包括:
编码器,被配置为从接收的语音数据提取向量值;和
解码器,被配置为基于向量值来输出与接收的语音数据对应的候选文本。
12.一种存储指令的非暂时性计算机可读存储介质,所述指令在被处理器执行时,使得所述处理器执行权利要求1的语音识别方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三星电子株式会社,未经三星电子株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010064349.7/1.html,转载请声明来源钻瓜专利网。