[发明专利]语音交互方法、装置及实现装置在审
申请号: | 201811099628.6 | 申请日: | 2018-09-20 |
公开(公告)号: | CN109102805A | 公开(公告)日: | 2018-12-28 |
发明(设计)人: | 石晓萌;汪世赓 | 申请(专利权)人: | 北京长城华冠汽车技术开发有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/16;G10L25/63;G10L15/06 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 吴莎 |
地址: | 101300 北京市顺*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音数据 命令执行状态 情绪特征 实现装置 语音交互 指令 中央控制器 接收用户 控制系统 人机交互 语音识别 预先建立 更新 回复 语音 输出 分析 | ||
本发明提供了一种语音交互方法、装置及实现装置;其中,该方法应用于车辆的中央控制器;该方法包括:接收用户的语音数据;根据语音数据更新当前的命令执行状态;命令执行状态包括执行中或不执行;当更新后的命令执行状态为执行中时,采用预先建立的语音识别模型对语音数据进行分析,得到语音数据对应的指令及情绪特征;根据指令及情绪特征,生成并输出回复语音。本发明提高了人与车辆的控制系统的进行人机交互的效率。
技术领域
本发明涉及人工智能(Artificial Intelligence,AI)技术领域,尤其是涉及一种语音交互方法、装置及实现装置。
背景技术
随着汽车电子技术的飞速发展,车辆的功能复杂性日益提高。除了对汽车本身的行驶性能的要求,其他个性化的客户需求千差万别,市场竞争越来越激烈。在汽车行驶过程中,人需要与汽车进行交互,如开启音乐,调节空调温度等;现有的交互方式一般采用按键式或点触式交互方式,该方式效率低,操作复杂。
发明内容
有鉴于此,本发明的目的在于提供一种语音交互方法、装置及实现装置,以提高人与车辆的控制系统的进行人机交互的效率。
第一方面,本发明实施例提供了一种语音交互方法,该方法应用于车辆的中央控制器;该方法包括:接收用户的语音数据;根据语音数据更新当前的命令执行状态;命令执行状态包括执行中或不执行;当更新后的命令执行状态为执行中时,采用预先建立的语音识别模型对语音数据进行分析,得到语音数据对应的指令及情绪特征;根据指令及情绪特征,生成并输出回复语音。
结合第一方面,本发明实施例提供了第一方面的第一种可能的实施方式,其中,上述根据语音数据更新当前的命令执行状态的步骤,包括:如果当前的命令执行状态为不执行,判断语音数据中是否包含预设的唤醒关键词;如果是,将命令执行状态更新为执行中。
结合第一方面,本发明实施例提供了第一方面的第二种可能的实施方式,其中,上述语音识别模型通过神经网络训练而成;语音识别模型的训练过程具体包括:建立神经网络的网络结构;获取设定数量的交互语音数据、对应的语音识别文本及情绪特征;将设定数量的交互语音数据、对应的语音识别文本及情绪特征输入到网络结构中进行训练,生成语音识别模型。
结合第一方面,本发明实施例提供了第一方面的第三种可能的实施方式,其中,上述根据指令及情绪特征,生成并输出回复语音的步骤,包括:在预先建立的语义数据库中,查找指令对应的回复内容;在预先建立的情绪特征数据库中,查找情绪特征对应的回复语气;将回复内容及回复语气合成为回复语音,输出回复语音。
结合第一方面的第三种可能的实施方式,本发明实施例提供了第一方面的第四种可能的实施方式,其中,上述方法还包括:输出回复语音后,开始计时;如果计时时长在设定的时长阈值内未收到语音数据,更新命令执行状态为不执行。
第二方面,本发明实施例还提供一种语音交互装置,该装置设置于车辆的中央控制器;该装置包括:语音接收模块,用于接收用户的语音数据;状态更新模块,用于根据语音数据更新当前的命令执行状态;命令执行状态包括执行中或不执行;语音识别模块,用于当更新后的命令执行状态为执行中时,采用预先建立的语音识别模型对语音数据进行分析,得到语音数据对应的指令及情绪特征;语音输出模块,用于根据指令及情绪特征,生成并输出回复语音。
结合第二方面,本发明实施例提供了第二方面的第一种可能的实施方式,其中,上述状态更新模块还用于:如果当前的命令执行状态为不执行,判断语音数据中是否包含预设的唤醒关键词;如果是,将命令执行状态更新为执行中。
结合第二方面,本发明实施例提供了第二方面的第二种可能的实施方式,其中,上述语音识别模型通过神经网络训练而成;语音识别模型的训练过程具体包括:建立神经网络的网络结构;获取设定数量的交互语音数据、对应的语音识别文本及情绪特征;将设定数量的交互语音数据、对应的语音识别文本及情绪特征输入到网络结构中进行训练,生成语音识别模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京长城华冠汽车技术开发有限公司,未经北京长城华冠汽车技术开发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811099628.6/2.html,转载请声明来源钻瓜专利网。