[发明专利]车辆智能语音交互方法、装置、设备及存储介质在审
申请号: | 202211428698.8 | 申请日: | 2022-11-15 |
公开(公告)号: | CN115798470A | 公开(公告)日: | 2023-03-14 |
发明(设计)人: | 邓鑫 | 申请(专利权)人: | 珠海市魅族科技有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L25/51;G06V40/16 |
代理公司: | 北京市京大律师事务所 11321 | 代理人: | 王文 |
地址: | 519000 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 车辆 智能 语音 交互 方法 装置 设备 存储 介质 | ||
1.一种车辆智能语音交互方法,其特征在于,所述车辆智能语音交互方法包括:
响应于接收到目标用户输入的唤醒语音指令,激活车辆中的语音助手服务;
调用车辆中预置的图像采集装置采集所述目标用户的目标人脸图像;
分别对所述目标人脸图像和所述唤醒语音指令执行特征提取,以分别得到所述目标用户的目标人脸特征和目标语音特征;
基于所述目标人脸特征和所述目标语音特征,在预置的车辆语音资源库中匹配所述目标用户对应的目标语音角色资源;
将所述目标语音角色资源加载至所述语音助手服务中;
基于所述语音助手服务与所述目标用户进行语音交互。
2.根据权利要求1所述的车辆智能语音交互方法,其特征在于,所述基于所述目标人脸特征和所述目标语音特征,在预置的车辆语音资源库中匹配所述目标用户对应的目标语音角色资源包括:
根据所述目标人脸特征,在所述车辆语音资源库中匹配至少一种候选语音角色资源;
若仅匹配到一种候选语音角色资源,则将所匹配的候选语音角色资源作为所述目标用户对应的目标语音角色资源;
若匹配到至少两种候选语音角色资源,则根据所述目标语音特征从所述至少两种候选语音角色资源中匹配所述目标用户对应的目标语音角色资源。
3.根据权利要求2所述的车辆智能语音交互方法,其特征在于,所述根据所述目标人脸特征,在所述车辆语音资源库中匹配至少一种候选语音角色资源包括:
对所述目标人脸特征执行特征解耦以将所述目标人脸特征分离为人脸五官特征和人脸表情特征;
基于所述人脸五官特征确定所述目标用户的性别和年龄,并根据所述目标用户的性别和年龄从所述车辆语音资源库中匹配多种初始语音角色资源;
基于所述人脸表情特征确定所述目标用户的表情信息,并根据所述目标用户的表情信息从所述多种初始语音角色资源中匹配至少一种候选语音角色资源。
4.根据权利要求2所述的车辆智能语音交互方法,其特征在于,所述若匹配到至少两种候选语音角色资源,则根据所述目标语音特征从所述至少两种候选语音角色资源中匹配所述目标用户对应的目标语音角色资源包括:
若匹配到至少两种候选语音角色资源,则对每种候选语音角色资源执行特征提取,得到每种候选语音角色资源对应的标准语音特征;
基于预置的相似度算法分别计算所述目标语音特征与每种标准语音特征之间的特征相似度;
根据所述目标语音特征与每种标准语音特征之间的特征相似度,确定所述目标用户对应的目标语音角色资源,其中,所述目标语音角色资源对应的标准语音特征与所述目标语音特征之间的特征相似度最大。
5.根据权利要求1-4中任一项所述的车辆智能语音交互方法,其特征在于,所述基于所述语音助手服务与所述目标用户进行语音交互包括:
计算所接收唤醒语音指令的目标声源方向;
根据所接收唤醒语音指令的目标声源方向,确定所述目标用户在车辆中目标乘坐位置;
基于目标音区内的声音输入输出装置与所述目标用户进行语音交互,其中,所述目标音区为所述目标乘坐位置所在的音区。
6.根据权利要求5所述的车辆智能语音交互方法,其特征在于,所述计算所接收唤醒语音指令的目标声源方向包括:
基于相对时延估计算法、信号子空间算法以及模态域算法中的任意一种算法计算所接收唤醒语音指令的目标声源方向。
7.根据权利要求5所述的车辆智能语音交互方法,其特征在于,所述计算所接收唤醒语音指令的目标声源方向包括:
基于数据统计特征,对所述目标语音特征执行声源方向的分类或聚类,得到所接收唤醒语音指令的目标声源方向。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于珠海市魅族科技有限公司,未经珠海市魅族科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211428698.8/1.html,转载请声明来源钻瓜专利网。