[发明专利]一种语音识别方法、装置、设备及存储介质在审

申请号：	202210013230.6	申请日：	2022-01-06
公开（公告）号：	CN114360542A	公开（公告）日：	2022-04-15
发明（设计）人：	李威;范渊;杨勃	申请（专利权）人：	杭州安恒信息技术股份有限公司
主分类号：	G10L15/22	分类号：	G10L15/22;G10L15/26;G10L15/30;G10L17/22;G10L21/04;H04L67/02
代理公司：	北京集佳知识产权代理有限公司 11227	代理人：	姚莹丽
地址：	310000 浙江省***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种语音识别方法装置设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请公开了一种语音识别方法、装置、设备及存储介质。该方法包括：通过浏览器采集用户语音，并按照预设转换规则将所述用户语音转换为目标格式的音频数据；对所述音频数据进行音频波形转换，得到待验证信号波形；将所述待验证信号波形与预先存储的权限用户的波形样本进行比对，判断波形是否匹配；若波形匹配，则通过应用程序接口调用第三方语音识别服务对所述音频数据进行识别，并接收语音识别结果。通过利用浏览器采集用户语音，并将用户语音转换为符合第三方语音识别服务的目标格式的音频数据，以便利用成熟的第三方语音识别服务进行语音识别，最终实现Web网站场景下精确的语音识别。

技术领域

本发明涉及语音识别技术领域，特别涉及一种语音识别方法、装置、设备及存储介质。

背景技术

目前，用户通常通过鼠标操作与Web网站进行交互，但是在某些场景下，如大屏演示环节，通过鼠标进行交互会降低延时的流畅性，存在寻找鼠标导致的卡顿现象等。现有技术中，移动端采用语音识别实现更高效的交互，而如何在Web网站实现精准的语音识别是目前亟需解决的问题。

发明内容

有鉴于此，本发明的目的在于提供一种语音识别方法、装置、设备及介质，能够在Web网站实现精准的语音识别。其具体方案如下：

第一方面，本申请公开了一种语音识别方法，包括：

通过浏览器采集用户语音，并按照预设转换规则将所述用户语音转换为目标格式的音频数据；

对所述音频数据进行音频波形转换，得到待验证信号波形；

将所述待验证信号波形与预先存储的权限用户的波形样本进行比对，判断波形是否匹配；

若波形匹配，则通过应用程序接口调用第三方语音识别服务对所述音频数据进行识别，并接收语音识别结果。

可选的，所述通过浏览器采集用户语音，包括：