[发明专利]用于车辆语音命令的言语辨识在审
申请号: | 201910636698.9 | 申请日: | 2019-07-15 |
公开(公告)号: | CN110797007A | 公开(公告)日: | 2020-02-14 |
发明(设计)人: | 兰贾尼·兰加拉詹;约翰·爱德华·胡贝尔;利亚·N·布施;约书亚·惠勒;斯科特·安德鲁·安曼 | 申请(专利权)人: | 福特全球技术公司 |
主分类号: | G10L15/00 | 分类号: | G10L15/00;G10L15/02;G10L15/06;G10L15/18;G10L15/22;G10L15/26;G10L15/30 |
代理公司: | 11278 北京连和连知识产权代理有限公司 | 代理人: | 刘小峰 |
地址: | 美国密歇根*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音命令 控制器 辨识 引擎 配置 方法和设备 存储器 车辆功能 用户历史 传声器 | ||
1.一种车辆,其包括:
传声器,所述传声器用于收集包括语音命令的信号;
存储器;以及
控制器,所述控制器被配置为:
通过将所述信号馈送到第一自动言语辨识(ASR)引擎中来确定初始识别;
通过将用户历史馈送到习惯引擎中来确定习惯;
通过将所述信号、所述初始识别和所述习惯馈送到第二ASR引擎中来识别所述语音命令;并且
基于所述语音命令执行车辆功能。
2.如权利要求1所述的车辆,其中所述控制器响应于确定所述初始识别与小于置信阈值的置信水平相对应而利用所述第二ASR引擎来识别所述语音命令。
3.如权利要求1所述的车辆,其中所述控制器响应于确定所述信号的噪声水平大于噪声阈值而利用所述第二ASR引擎来识别所述语音命令。
4.如权利要求1所述的车辆,其中所述控制器响应于确定以下而将所述初始识别识别为所述语音命令:
所述初始识别与大于置信阈值的置信水平相对应;以及
所述信号的噪声水平小于噪声阈值。
5.如权利要求1所述的车辆,其中所述第一ASR引擎包括:
声学模型,所述声学模型用于识别所述信号内的方言的一个或多个音素;以及
语言模型,所述语言模型用于通过基于由所述声学模型识别的所述一个或多个音素确定字词概率分布来识别所述信号内的一个或多个字词。
6.如权利要求1所述的车辆,其中所述第二ASR引擎包括深度神经网络。
7.如权利要求1所述的车辆,其中所述习惯引擎包括模式辨识算法。
8.如权利要求1所述的车辆,其还包括一个或多个输入装置,其中所述控制器基于由所述一个或多个输入装置接收的用户输入来确定所述用户历史。
9.一种系统,其包括:
车辆,所述车辆用于基于语音命令操作,所述车辆包括用于收集包括所述语音命令的信号的传声器;以及
远程服务器,所述远程服务器与所述车辆通信,用于:
经由第一引擎基于所述信号确定初始识别;
经由习惯引擎确定习惯;并且
经由第二引擎基于所述信号、所述初始识别和所述习惯识别用于所述车辆的所述语音命令。
10.如权利要求9所述的系统,其中所述远程服务器响应于确定所述初始识别与小于置信阈值的置信水平相对应而利用所述第二引擎来识别所述语音命令。
11.如权利要求9所述的系统,其中所述远程服务器响应于确定所述信号的噪声水平大于噪声阈值而利用所述第二引擎来识别所述语音命令。
12.如权利要求9所述的系统,其中所述远程服务器响应于确定以下而将所述初始识别识别为所述语音命令:
所述初始识别与大于置信阈值的置信水平相对应;以及
所述信号的噪声水平小于噪声阈值。
13.如权利要求9所述的系统,其中所述第一引擎包括:
声学模型,所述声学模型用于识别所述信号内的方言的一个或多个音素;以及
语言模型,所述语言模型用于通过基于由所述声学模型识别的所述一个或多个音素确定字词概率分布来识别所述信号内的一个或多个字词。
14.如权利要求9所述的系统,其中所述第二引擎包括深度神经网络。
15.一种方法,其包括:
经由车辆传声器收集包括语音命令的信号;
通过将所述信号馈送到第一自动言语辨识(ASR)引擎中来确定初始识别;
通过将用户历史馈送到习惯引擎中来确定习惯;
通过将所述信号、所述初始识别和所述习惯馈送到第二ASR引擎中来识别所述语音命令;以及
经由处理器基于所述语音命令执行车辆功能。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福特全球技术公司,未经福特全球技术公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910636698.9/1.html,转载请声明来源钻瓜专利网。