[发明专利]语音识别方法、系统、计算机设备及计算机可读存储介质有效
申请号: | 201711031665.9 | 申请日: | 2017-10-27 |
公开(公告)号: | CN107871499B | 公开(公告)日: | 2020-06-16 |
发明(设计)人: | 秦浩然;肖全之 | 申请(专利权)人: | 珠海市杰理科技股份有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/05;G10L15/08;G10L15/26;G10L25/69 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 黄晓庆 |
地址: | 519085 广东省珠海市吉*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 方法 系统 计算机 设备 可读 存储 介质 | ||
本申请涉及一种语音识别方法、系统、计算机设备及存储介质。包括将语音信号特征序列输入单音素搜索网络和集内词搜索网络进行同步解码;获取集内词搜索网络解码得到的集内词输出状态分数;当集内词输出状态分数满足预设条件时,获取单音素搜索网络与集内词搜索网络同步解码的置信度;根据置信度选择对应的解码路径,输出得到语音识别结果。上述语音识别方法、系统、计算机设备及计算机可读存储介质,通过同时将语音信号特征序列输入单音素搜索网络和集内词搜索网络进行解码传递,能有效地实现集内词识别和集外词拒识别,确保识别准确率;再根据置信度选择对应的解码路径得到语音识别结果,可以进一步提高语音识别准确度。
技术领域
本申请涉及语音识别技术领域,特别是涉及一种语音识别方法、系统、计算机设备及计算机可读存储介质。
背景技术
随着计算机技术的快速发展及应用,进一步实现与机器进行语音交流是人工智能和机器学习应用的一个重要方向,语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的技术。目前语音识别的应用可主要分为两个方向:一个是大词汇连续语音识别系统,它被应用于手机助理,语音听写等;另外一个是向小词汇便携型语音产品发展,如智能玩具,家电遥控等。
其中第二种应用中的小词汇语音识别系统已逐渐开始在手持终端、家电等领域得到应用,因为其面向的是小词汇,所以相对于第一种系统除了噪声干扰带来的影响外还要考虑大量的集外词的干扰,即要保证集内词正确识别的同时还要拒绝集外词。而传统的小词汇语音识别系统的产品使用效果仍不尽如人意,如无法有效地实现集内命令词识别和集外词拒识别,语音识别准确度低。
发明内容
基于此,有必要针对上述问题,提供一种能有效地实现集内词识别和集外词拒识别,提高识别准确率的语音识别方法、系统、计算机设备及计算机可读存储介质。
一种语音识别方法,包括:
将语音信号特征序列分别输入单音素搜索网络和集内词搜索网络,并进行同步解码;
获取所述同步解码得到的集内词输出状态分数;
当所述集内词输出状态分数满足预设条件时,获取所述单音素搜索网络与所述集内词搜索网络同步解码的置信度;
根据所述置信度选择对应的解码路径,输出得到语音识别结果。
在一个实施例中,所述将语音信号特征序列分别输入单音素搜索网络和集内词搜索网络,并进行同步解码的步骤包括:
将当前帧语音信号特征序列输入所述单音素搜索网络,得到第一输出状态分数;
当所述第一输出状态分数大于第一预设阈值时,将下一帧语音信号特征序列分别输入所述单音素搜索网络和所述集内词搜索网络进行同步解码。
在一个实施例中,所述将当前帧语音信号特征序列输入所述单音素搜索网络,得到第一输出状态分数的步骤包括:
将所述当前帧语音信号特征序列输入所述单音素搜索网络;
获取所述当前帧语音信号特征序列与所述单音素搜索网络基元的联合概率;
将所述联合概率中的最大值作为所述第一输出状态分数。
在一个实施例中,所述当所述集内词输出状态分数满足预设条件时,获取所述单音素搜索网络与所述集内词搜索网络同步解码的置信度的步骤包括:
当所述集内词输出状态分数满足所述预设条件时,获取所述单音素搜索网络同步解码的第一传递分数和所述集内词搜索网络同步解码的第二传递分数;
根据所述第一传递分数和所述第二传递分数,得到所述置信度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于珠海市杰理科技股份有限公司,未经珠海市杰理科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711031665.9/2.html,转载请声明来源钻瓜专利网。