[发明专利]一种语音识别方法、装置、设备及存储介质在审
申请号: | 202210013230.6 | 申请日: | 2022-01-06 |
公开(公告)号: | CN114360542A | 公开(公告)日: | 2022-04-15 |
发明(设计)人: | 李威;范渊;杨勃 | 申请(专利权)人: | 杭州安恒信息技术股份有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/26;G10L15/30;G10L17/22;G10L21/04;H04L67/02 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 姚莹丽 |
地址: | 310000 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 识别 方法 装置 设备 存储 介质 | ||
1.一种语音识别方法,其特征在于,应用于Web网站,包括:
通过浏览器采集用户语音,并按照预设转换规则将所述用户语音转换为目标格式的音频数据;
对所述音频数据进行音频波形转换,得到待验证信号波形;
将所述待验证信号波形与预先存储的权限用户的波形样本进行比对,判断波形是否匹配;
若波形匹配,则通过应用程序接口调用第三方语音识别服务对所述音频数据进行识别,并接收语音识别结果。
2.根据权利要求1所述的语音识别方法,其特征在于,所述通过浏览器采集用户语音,包括:
通过浏览器按照第一循环采集规则采集用户语音;所述第一循环采集规则包括第一预设时间间隔;
相应的,所述接收语音识别结果之后,还包括:
根据所述语音识别结果和预设语音口令库判断所述用户语音是否为唤醒指令;
若所述用户语音不是所述唤醒指令,则执行所述通过浏览器按照第一循环采集规则采集用户语音的操作;
若所述用户语音是所述唤醒指令,则通过浏览器按照第二循环采集规则采集用户语音指令,并通过所述第三方语音识别服务识别所述用户语音指令得到语音指令识别结果,然后根据所述语音指令识别结果和所述预设语音口令库确定出所述语音指令识别结果对应的操作类型,并根据所述操作类型执行相应的交互操作。
3.根据权利要求2所述的语音识别方法,其特征在于,所述根据所述语音指令识别结果和所述预设语音口令库确定出所述语音指令识别结果对应的操作类型之前,还包括:
通过超文本标记语言创建用于配置语音指令和操作类型的映射关系的配置页面,以便根据获取的用户识别需求通过所述配置页面配置语音指令和操作类型的映射关系。
4.根据权利要求1所述的语音识别方法,其特征在于,所述按照预设转换规则将所述用户语音转换为目标格式的音频数据,包括:
确定出所述第三方语音识别服务对应的格式要求;
按照所述格式要求对应的预设转换规则将所述用户语音转换为波形声音文件,以便所述波形声音文件对应的采样率、声道数、音调和音质符合所述第三方语音识别服务的识别规定。
5.根据权利要求1所述的语音识别方法,其特征在于,所述通过浏览器采集用户语音,包括:
通过navigator.mediaDevices.getUserMedia调用麦克风并录制声音,以得到所述用户语音。
6.根据权利要求1所述的语音识别方法,其特征在于,所述对所述音频数据进行音频波形转换,得到待验证信号波形,包括:
通过python音频处理库对所述音频数据进行音频波形转换,得到用于表征波形曲线特征的振幅图作为所述待验证信号波形;所述波形曲线特征包括采样率、通道数、位深和帧数。
7.根据权利要求1至6任一项所述的语音识别方法,其特征在于,所述将所述待验证信号波形与预先存储的权限用户的波形样本进行比对,判断波形是否匹配,包括:
计算所述待验证信号波形与预先存储的权限用户的波形样本之间的相关系数;
根据所述相关系数与预设系数阈值的大小关系,判断所述待验证信号波形与所述波形样本是否匹配。
8.一种语音识别装置,其特征在于,应用于Web网站,包括:
格式转换模块,用于通过浏览器采集用户语音,并按照预设转换规则将所述用户语音转换为目标格式的音频数据;
音频转换模块,用于对所述音频数据进行音频波形转换,得到待验证信号波形;
波形比对模块,用于将所述待验证信号波形与预先存储的权限用户的波形样本进行比对,判断波形是否匹配;
语音识别模块,用于若波形匹配,则通过应用程序接口调用第三方语音识别服务对所述音频数据进行识别,并接收语音识别结果。
9.一种电子设备,其特征在于,包括:
存储器,用于保存计算机程序;
处理器,用于执行所述计算机程序,以实现如权利要求1至7任一项所述的语音识别方法。
10.一种计算机可读存储介质,其特征在于,用于存储计算机程序;其中计算机程序被处理器执行时实现如权利要求1至7任一项所述的语音识别方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州安恒信息技术股份有限公司,未经杭州安恒信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210013230.6/1.html,转载请声明来源钻瓜专利网。