[发明专利]语音识别方法及相关产品在审
申请号: | 201810801238.2 | 申请日: | 2017-10-30 |
公开(公告)号: | CN109003603A | 公开(公告)日: | 2018-12-14 |
发明(设计)人: | 不公告发明人 | 申请(专利权)人: | 上海寒武纪信息科技有限公司 |
主分类号: | G10L15/16 | 分类号: | G10L15/16;G10L15/26;G10L15/28 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郝传鑫;熊永强 |
地址: | 201306 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音识别 计算装置 运算指令 语音 目标文本信息 预先设置 运算单元 和运算 调用 指令 申请 | ||
本公开提供了一种语音识别方法,所述方法应用于计算装置内,所述计算装置包括:DMA单元和运算单元;所述方法包括如下步骤:通过DMA单元获取用户输入的待识别语音;运算单元调用运算指令对所述待识别语音进行语音识别处理,从而获得所述待识别语音所对应的目标文本信息;其中,所述运算指令为预先设置用于语音识别的指令。本申请提供的技术方案具有进行语音识别时计算速度快,效率高的优点。
技术领域
本申请涉及信息处理技术领域,具体涉及一种语音识别方法及相关产品。
背景技术
随着信息技术的不断发展和人们日益增长的需求,人们对信息及时性的要求越来越高了。目前,终端对信息的获取以及处理均是基于通用处理器获得的,例如在通用处理器运行指定应用程序以实现语言的翻译以及语言的回复等等。
在实践中发现,这种基于通用处理器运行软件程序来处理信息的方式,受限于通用处理器的运行速率,特别是在通用处理器负荷较大的情况下,语音识别效率较低、时延较大。
本申请实施例提供了一种语音识别方法及相关产品,可提升计算装置进行语音识别的处理速度,提高效率。
第一方面,提供一种语音识别方法,应用于计算装置内,所述计算装置包括运算单元直接内存访问DMA单元,所述DMA单元包括DMA控制器和寄存器模块;所述方法包括:
所述DMA控制器从所述寄存器模块获取第一地址和第二地址;所述DMA控制器从所述第一地址对应的存储空间中获取用户输入的待识别语音;
所述运算单元获取运算指令,以调用所述运算指令对所述待识别语音进行语音识别处理,从而获得所述待识别语音所对应的目标文本信息;并将所述目标文本信息发送至所述DMA控制器;其中,所述运算指令为预先设置用于语音识别的指令;
DMA控制器将所述目标分类结果存储至所述第二地址对应的存储空间中。
在一些可能的实施例中,所述计算装置还包括寄存器单元以及控制器单元,所述运算单元获取运算指令,以调用所述运算指令对所述待识别语音进行语音识别处理,从而获得所述待识别语音所对应的目标文本信息包括:
所述控制器单元从所述寄存器单元中提取第一运算指令以及网络模型关联的第二运算指令,并发送给所述运算单元;
所述运算单元调用所述第一运算指令对所述待识别语音进行预处理,从而获得待识别的中间语音,所述预处理包括时频转换;
所述运算单元调用所述网络模型关联的第二运算指令对所述中间语音进行语音识别处理,从而获得目标文本信息;
其中,所述网络模型包括预置的神经网络模型或者非神经网络模型。
在一些可能的实施例中,所述第一运算指令为用于构成时频转换算法的指令,所述时频转换算法包括以下中的至少一项:快速傅里叶变换算法、矩形窗算法、汉明窗算法以及神经网络算法。
在一些可能的实施例中,所述调用所述网络模型关联的第二运算指令对所述中间语音进行语音识别处理,从而获得目标文本信息包括:
所述运算单元调用所述网络模型关联的第二运算指令,对所述中间语音进行语音识别,从而获得多个文本信息;
所述运算单元调用第三运算指令,分别计算所述多个文本信息各自对应的得分,以从多个得分中选取得分超过预设阈值的文本信息,作为所述目标文本信息。
在一些可能的实施例中,所述第三运算指令为排序算法关联的指令,所述排序算法包括以下中的任一项:维特比算法、束搜索算法、A*算法、WFST算法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海寒武纪信息科技有限公司,未经上海寒武纪信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810801238.2/2.html,转载请声明来源钻瓜专利网。