[发明专利]噪声环境中的话音或语音识别在审

专利信息
申请号: 202080102085.8 申请日: 2020-06-22
公开(公告)号: CN115943689A 公开(公告)日: 2023-04-07
发明(设计)人: 董晓霞;魏军;潘启蒙 申请(专利权)人: 高通股份有限公司
主分类号: H04W64/00 分类号: H04W64/00
代理公司: 上海专利商标事务所有限公司 31100 代理人: 陈炜;唐杰敏
地址: 美国加利*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 噪声 环境 中的 话音 语音 识别
【说明书】:

各实施例包括由计算设备的处理器执行的用于噪声环境中的话音/语音识别的方法。在各个实施例中,话音或语音识别可以由计算设备的处理器执行,这可以包括基于音频输入在其处被接收到的位置来确定要用于话音和/或语音识别的话音识别模型,以及使用所确定的话音识别模型对该音频输入执行话音和/或语音识别。一些实施例可以从计算设备接收音频输入以及与该音频输入在其处被记录的位置相关联的位置信息。接收到的音频输入可被用于生成与音频输入在其处被记录的位置相关联的话音识别模型以供在话音和/或语音识别中使用。所生成的与该位置相关联的话音识别模型可被提供到计算设备。

背景

现代计算设备(如蜂窝电话、膝上型计算机、平板和台式机)使用语音和/或话音识别来用于各种功能。语音识别提取说出的单词,而话音识别(称为说话者标识)标识正在说话的话音,而不是说出的单词。由此,语音识别确定“某人说了什么”,而话音识别确定“谁说的”。语音识别便于向计算设备提供口头命令,从而消除了触摸或直接使用键盘或触摸屏的需要。话音识别提供了类似的便利,但也可以用作标识认证工具。并且,标识说话者可以通过使用为该说话者定制的更合适的话音识别模型来改进语音识别。虽然当代软件/硬件已经改进了对语音和话音识别的细微差别的破译,但是这种系统的准确性通常受到环境噪声的影响。即使是试图滤除环境噪声的系统也难以考虑到发生在不同位置或位置类型中的环境噪声的变化。

概述

各个方面包括实现由计算设备的处理器执行的用于在噪声环境中的话音和/或语音识别的方法的方法和计算设备。各个方面可包括由计算设备的处理器执行的话音或语音识别,这可以包括基于音频输入在其处被接收到的位置来确定要用于话音和/或语音识别的话音识别模型,以及使用所确定的话音识别模型对该音频输入执行话音和/或语音识别。

进一步方面可以包括使用全球定位系统信息、环境噪声和/或通信网络信息来确定该音频输入在其处被接收到的位置。在一些方面,确定要用于话音和/或语音识别的话音识别模型可以包括从多个话音识别模型中选择该话音识别模型,其中该多个话音识别模型中的每一者与不同的场景类别相关联,每一个场景类别具有指定的音频简档。在一些方面,使用所确定的话音识别模型对该音频输入执行话音和/或语音识别可以包括使用所确定的语音识别模型来针对环境噪声调整该音频输入以及对经调整的音频输入执行话音和/或语音识别。

进一步方面可以包括接收与该位置处的环境噪声采样相关联的音频输入,将该位置或位置类别与接收到的音频输入相关联,以及将该音频输入和相关联的位置或位置类别信息传送到远程计算设备以用于基于接收到的音频输入来针对该相关联的位置或位置类别生成话音识别模型。

进一步方面可以包括根据与该位置处的环境噪声相关联的音频输入来编译音频简档,将该位置或位置类别与经编译的音频简档相关联,以及将与该位置或位置类别相关联的音频简档传送到远程计算设备以用于基于经编译的音频简档来针对该位置或位置类别生成该话音识别模型。

各个方面可以使用计算设备来生成语音识别模型。语音识别模型的生成可以包括:从远离该计算设备的用户装备接收音频输入以及与该音频输入在其处被记录的位置相关联的位置信息,使用接收到的音频输入来生成与该位置相关联的话音识别模型以供在话音和/或语音识别中使用,以及将所生成的与该位置相关联的话音识别模型提供到用户装备。

在进一步方面,接收音频输入和位置信息还可以包括接收多个音频输入,每个音频输入具有与不同位置相关联的位置信息。此外,使用接收到的音频输入来生成与该位置相关联的话音识别模型还可以包括使用接收到的多个音频输入来生成话音识别模型,其中所生成的话音识别模型中的每一者可以被配置成在该不同位置中的相应一个位置处使用。

进一步方面还可以包括基于从用户装备接收的位置信息来确定位置类别,以及将所生成的话音识别模型与所确定的位置类别相关联。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于高通股份有限公司,未经高通股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202080102085.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top