[发明专利]语音交互方法、装置及实现装置在审

申请号：	201811099628.6	申请日：	2018-09-20
公开（公告）号：	CN109102805A	公开（公告）日：	2018-12-28
发明（设计）人：	石晓萌;汪世赓	申请（专利权）人：	北京长城华冠汽车技术开发有限公司
主分类号：	G10L15/22	分类号：	G10L15/22;G10L15/16;G10L25/63;G10L15/06
代理公司：	北京超凡志成知识产权代理事务所(普通合伙) 11371	代理人：	吴莎
地址：	101300 北京市顺***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音数据命令执行状态情绪特征实现装置语音交互指令中央控制器接收用户控制系统人机交互语音识别预先建立更新回复语音输出分析
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明提供了一种语音交互方法、装置及实现装置；其中，该方法应用于车辆的中央控制器；该方法包括：接收用户的语音数据；根据语音数据更新当前的命令执行状态；命令执行状态包括执行中或不执行；当更新后的命令执行状态为执行中时，采用预先建立的语音识别模型对语音数据进行分析，得到语音数据对应的指令及情绪特征；根据指令及情绪特征，生成并输出回复语音。本发明提高了人与车辆的控制系统的进行人机交互的效率。

技术领域

本发明涉及人工智能(Artificial Intelligence，AI)技术领域，尤其是涉及一种语音交互方法、装置及实现装置。

背景技术

随着汽车电子技术的飞速发展，车辆的功能复杂性日益提高。除了对汽车本身的行驶性能的要求，其他个性化的客户需求千差万别，市场竞争越来越激烈。在汽车行驶过程中，人需要与汽车进行交互，如开启音乐，调节空调温度等；现有的交互方式一般采用按键式或点触式交互方式，该方式效率低，操作复杂。

发明内容

有鉴于此，本发明的目的在于提供一种语音交互方法、装置及实现装置，以提高人与车辆的控制系统的进行人机交互的效率。

第一方面，本发明实施例提供了一种语音交互方法，该方法应用于车辆的中央控制器；该方法包括：接收用户的语音数据；根据语音数据更新当前的命令执行状态；命令执行状态包括执行中或不执行；当更新后的命令执行状态为执行中时，采用预先建立的语音识别模型对语音数据进行分析，得到语音数据对应的指令及情绪特征；根据指令及情绪特征，生成并输出回复语音。

结合第一方面，本发明实施例提供了第一方面的第一种可能的实施方式，其中，上述根据语音数据更新当前的命令执行状态的步骤，包括：如果当前的命令执行状态为不执行，判断语音数据中是否包含预设的唤醒关键词；如果是，将命令执行状态更新为执行中。

结合第一方面，本发明实施例提供了第一方面的第二种可能的实施方式，其中，上述语音识别模型通过神经网络训练而成；语音识别模型的训练过程具体包括：建立神经网络的网络结构；获取设定数量的交互语音数据、对应的语音识别文本及情绪特征；将设定数量的交互语音数据、对应的语音识别文本及情绪特征输入到网络结构中进行训练，生成语音识别模型。

结合第一方面，本发明实施例提供了第一方面的第三种可能的实施方式，其中，上述根据指令及情绪特征，生成并输出回复语音的步骤，包括：在预先建立的语义数据库中，查找指令对应的回复内容；在预先建立的情绪特征数据库中，查找情绪特征对应的回复语气；将回复内容及回复语气合成为回复语音，输出回复语音。

结合第一方面的第三种可能的实施方式，本发明实施例提供了第一方面的第四种可能的实施方式，其中，上述方法还包括：输出回复语音后，开始计时；如果计时时长在设定的时长阈值内未收到语音数据，更新命令执行状态为不执行。

第二方面，本发明实施例还提供一种语音交互装置，该装置设置于车辆的中央控制器；该装置包括：语音接收模块，用于接收用户的语音数据；状态更新模块，用于根据语音数据更新当前的命令执行状态；命令执行状态包括执行中或不执行；语音识别模块，用于当更新后的命令执行状态为执行中时，采用预先建立的语音识别模型对语音数据进行分析，得到语音数据对应的指令及情绪特征；语音输出模块，用于根据指令及情绪特征，生成并输出回复语音。

结合第二方面，本发明实施例提供了第二方面的第一种可能的实施方式，其中，上述状态更新模块还用于：如果当前的命令执行状态为不执行，判断语音数据中是否包含预设的唤醒关键词；如果是，将命令执行状态更新为执行中。

结合第二方面，本发明实施例提供了第二方面的第二种可能的实施方式，其中，上述语音识别模型通过神经网络训练而成；语音识别模型的训练过程具体包括：建立神经网络的网络结构；获取设定数量的交互语音数据、对应的语音识别文本及情绪特征；将设定数量的交互语音数据、对应的语音识别文本及情绪特征输入到网络结构中进行训练，生成语音识别模型。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京长城华冠汽车技术开发有限公司，未经北京长城华冠汽车技术开发有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201811099628.6/2.html，转载请声明来源钻瓜专利网。

上一篇：一种语音病历终端输入的方法及其系统
下一篇：用于语音交互的方法、装置、设备和计算机可读存储介质

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]语音交互方法、装置及实现装置在审

专利文献下载