[发明专利]一种语音识别方法和相关装置在审
申请号: | 202210042387.1 | 申请日: | 2022-01-14 |
公开(公告)号: | CN114360510A | 公开(公告)日: | 2022-04-15 |
发明(设计)人: | 袁有根;吕志强;黄申 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/16 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 罗晓敏 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 识别 方法 相关 装置 | ||
1.一种语音识别方法,其特征在于,所述方法包括:
获取声学模型和待识别的语音数据,所述声学模型包括时延神经网络,所述时延神经网络的输出层包括与多个音节分别对应的声学建模单元;
将所述语音数据作为所述时延神经网络的输入数据,通过所述时延神经网络确定所述语音数据所包括语音帧分别对应的音节概率分布,所述音节概率分布用于标识所述语音帧与所述多个音节分别对应的概率;
根据所述音节概率分布确定所述语音数据对应的语音识别结果。
2.根据权利要求1所述的方法,其特征在于,所述声学模型还包括解码器,所述根据所述音节概率分布确定所述语音数据对应的语音识别结果,包括:
根据所述语音数据对应的唤醒场景,确定与所述唤醒场景对应的关键词;
根据所述音节概率分布,通过所述解码器确定用于标识所述语音数据中是否包括所述关键词的语音识别结果;
所述方法还包括:
若所述语音识别结果指示所述语音数据中包括所述关键词,将所述唤醒场景对应终端设备唤醒。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
以音节为划分粒度构建针对所述关键词的匹配词表;
所述根据所述音节概率分布,通过所述解码器确定用于标识所述语音数据中是否包括所述关键词的语音识别结果,包括:
根据所述音节概率分布和所述匹配词表,通过所述解码器确定用于标识所述语音数据中是否包括所述关键词的语音识别结果。
4.根据权利要求1所述的方法,其特征在于,所述时延神经网络包括N层特征提取层,j∈N,针对所述语音数据所包括语音帧中的第i帧语音帧,所述将所述语音数据作为所述时延神经网络的输入数据,通过所述时延神经网络确定所述语音数据所包括语音帧分别对应的音节概率分布,包括:
根据第j-1层特征提取层针对所述第i帧语音帧的输出特征,通过第j层特征提取层确定所述第i帧语音帧的语音帧特征;
通过所述语音帧特征和所述第i帧语音帧在所述语音数据中的前后至少一帧对应的语音帧特征,确定所述第i帧语音帧在所述第j层特征提取层的输出特征;
根据所述第i帧语音帧在所述第j层特征提取层的输出特征,确定所述第i帧语音帧对应的音节概率分布。
5.根据权利要求3所述的方法,其特征在于,所述方法还包括:
根据发音相似程度确定所述关键词所包括音节的相似音节;
若所述关键词中具有多音字,确定所述多音字对应的多音字音节;
所述以音节为划分粒度构建针对所述关键词的匹配词表,包括:
根据所述相似音节和所述多音字音节中的至少一个,以及所述关键词对应的音节,以音节为划分粒度构建针对所述关键词的匹配词表。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取与所述语音数据属于同一语种的语音样本;
根据所述语音样本作为初始声学模型的输入数据,通过所述初始声学模型包括的初始时延神经网络得到预测结果;
根据所述预测结果与所述语音样本的样本标签确定损失函数,所述损失函数中包括指导权重,所述指导权重用于提高正确预测结果在所述初始时延神经网络中的识别路径的影响,降低错误预测结果在所述初始时延神经网络中的识别路径的影响;
根据所述损失函数调整所述初始声学模型中初始时延神经网络的模型参数,以得到所述声学模型。
7.根据权利要求6所述的方法,其特征在于,所述获取与所述语音数据属于同一语种的语音样本,包括:
获取与所述语音数据属于同一语种的待处理语音样本;
根据所述待处理语音样本进行数据增广得到增广样本,所述增广样本的样本标签基于所对应待处理语音样本的样本标签确定;
根据所述待处理语音样本和所述增广样本得到所述语音样本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210042387.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种蠕墨铸铁玻璃模具及其制备方法
- 下一篇:基于参考的语音增强方法