[发明专利]噪声环境中的话音或语音识别在审
申请号: | 202080102085.8 | 申请日: | 2020-06-22 |
公开(公告)号: | CN115943689A | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 董晓霞;魏军;潘启蒙 | 申请(专利权)人: | 高通股份有限公司 |
主分类号: | H04W64/00 | 分类号: | H04W64/00 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 陈炜;唐杰敏 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 噪声 环境 中的 话音 语音 识别 | ||
1.一种由计算设备的处理器执行的话音或语音识别的方法,包括:
基于音频输入在其处被接收到的位置来确定要用于话音或语音识别的话音识别模型;以及
使用所确定的话音识别模型对所述音频输入执行话音或语音识别。
2.如权利要求1所述的方法,进一步包括:
使用全球定位系统信息来确定所述音频输入在其处被接收到的所述位置。
3.如权利要求1所述的方法,进一步包括:
使用环境噪声来确定所述音频输入在其处被接收到的所述位置。
4.如权利要求1所述的方法,进一步包括:
使用通信网络信息来确定所述音频输入在其处被接收到的所述位置。
5.如权利要求1所述的方法,其中,确定要用于话音或语音识别的话音识别模型包括:
从多个话音识别模型中选择所述话音识别模型,其中所述多个话音识别模型中的每一者与不同的场景类别相关联,每个场景类别具有指定的音频简档。
6.如权利要求1所述的方法,其中,使用所确定的话音识别模型对所述音频输入执行话音或语音识别包括:
使用所述所确定的话音识别模型来针对环境噪声调整所述音频输入;以及
对经调整的音频输入执行话音和/或语音识别。
7.如权利要求1所述的方法,进一步包括:
接收与所述位置处的环境噪声采样相关联的音频输入;
将所述位置或位置类别与接收到的音频输入相关联;以及
将所述音频输入和相关联的位置或位置类别信息传送到远程计算设备以用于基于接收到的音频输入来针对相关联的所述位置或位置类别生成所述话音识别模型。
8.如权利要求1所述的方法,进一步包括:
根据与所述位置处的环境噪声相关联的音频输入来编译音频简档;
将所述位置或位置类别与经编译的音频简档相关联;以及
将与所述位置或位置类别相关联的音频简档传送到远程计算设备以用于基于经编译的音频简档来针对所述位置或位置类别生成所述话音识别模型。
9.一种计算设备,包括:
话筒;
存储器;以及
处理器,所述处理器耦合到所述话筒和所述存储器并且被配置有用于以下操作的处理器可执行指令:
基于音频输入在其处经由所述话筒被接收到的位置来确定要用于话音或语音识别的话音识别模型;以及
使用所确定的话音识别模型对所述音频输入执行话音或语音识别。
10.如权利要求9所述的计算设备,进一步包括全球定位系统接收机,
其中所述处理器被进一步配置有用于以下操作的处理器可执行指令:使用全球定位系统信息来确定所述音频输入在其处被接收到的所述位置。
11.如权利要求9所述的计算设备,其中,所述处理器被进一步配置有用于以下操作的处理器可执行指令:使用环境噪声来确定所述音频输入在其处被接收到的所述位置。
12.如权利要求9所述的计算设备,其中,所述处理器被进一步配置有用于以下操作的处理器可执行指令:使用通信网络信息来确定所述音频输入在其处被接收到的所述位置。
13.如权利要求9所述的计算设备,其中,所述处理器被进一步配置有用于通过以下操作来确定要用于话音或语音识别的话音识别模型的处理器可执行指令:
从存储在所述存储器中的多个话音识别模型中选择所述话音识别模型,其中所述多个话音识别模型中的每一者与不同的场景类别相关联,每个场景类别具有指定的音频简档。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于高通股份有限公司,未经高通股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202080102085.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:旋转电机及旋转电机的制造方法
- 下一篇:淋巴传导系统植入件