[发明专利]车辆智能语音交互方法、装置、设备及存储介质在审
申请号: | 202211428698.8 | 申请日: | 2022-11-15 |
公开(公告)号: | CN115798470A | 公开(公告)日: | 2023-03-14 |
发明(设计)人: | 邓鑫 | 申请(专利权)人: | 珠海市魅族科技有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L25/51;G06V40/16 |
代理公司: | 北京市京大律师事务所 11321 | 代理人: | 王文 |
地址: | 519000 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 车辆 智能 语音 交互 方法 装置 设备 存储 介质 | ||
本申请涉及智能驾驶领域,公开了一种车辆智能语音交互方法、装置、设备及存储介质。该方法包括:响应于接收到目标用户输入的唤醒语音指令,激活车辆中的语音助手服务;调用车辆中的图像采集装置采集目标用户的目标人脸图像;分别对目标人脸图像和唤醒语音指令执行特征提取,以分别得到目标用户的目标人脸特征和目标语音特征;基于目标人脸特征和目标语音特征,匹配目标用户对应的目标语音角色资源;将目标语音角色资源加载至语音助手服务中;基于语音助手服务与目标用户进行语音交互。本发明能够根据用户的人脸图像与说话的声音,加载与用户个人形象最为匹配的语音角色资源,进而满足用户对车辆智能语音交互的个性化体验。
技术领域
本申请涉及智能驾驶领域,尤其涉及一种车辆智能语音交互方法、装置、设备及存储介质。
背景技术
随着语音识别技术不断发展,其识别精度已能够满足工业级别的应用,例如在智能驾驶领域中基于语音识别技术可对汽车进行智能控制、语音聊天等交互。
在现有的技术中,通常以系统默认的声音与用户进行语音交互,该声音机械化且没有情感,不能满足用户的个性化需求。
申请内容
本申请实施例提供一种车辆智能语音交互方法,能够根据用户的人脸图像与说话的声音,加载与用户个人形象最为匹配的语音角色资源,进而满足用户对车辆智能语音交互的个性化体验。
第一方面,本申请实施例提供一种车辆智能语音交互方法,响应于接收到目标用户输入的唤醒语音指令,激活车辆中的语音助手服务;调用车辆中预置的图像采集装置采集目标用户的目标人脸图像;分别对目标人脸图像和唤醒语音指令执行特征提取,以分别得到目标用户的目标人脸特征和目标语音特征;基于目标人脸特征和目标语音特征,在预置的车辆语音资源库中匹配目标用户对应的目标语音角色资源;将目标语音角色资源加载至语音助手服务中;基于语音助手服务与目标用户进行语音交互。
基于本申请实施例提供的方法,通过根据用户的人脸图像特征及其声音特征从而获取到与用户最为匹配的目标语音角色资源,将该目标语音角色资源加载到语音助手服务中以使用对应的语音与用户进行交互,从而提升车辆智能语音交互的个性化体验。
在一种可能的实现方式中,基于目标人脸特征和目标语音特征,在预置的车辆语音资源库中匹配目标用户对应的目标语音角色资源包括:根据目标人脸特征,在车辆语音资源库中匹配至少一种候选语音角色资源;若仅匹配到一种候选语音角色资源,则将所匹配的候选语音角色资源作为目标用户对应的目标语音角色资源;若匹配到至少两种候选语音角色资源,则根据目标语音特征从该至少两种候选语音角色资源中匹配目标用户对应的目标语音角色资源。
在一种可能的实现方式中,根据目标人脸特征,在车辆语音资源库中匹配至少一种候选语音角色资源包括:对目标人脸特征执行特征解耦以将目标人脸特征分离为人脸五官特征和人脸表情特征;基于人脸五官特征确定目标用户的性别和年龄,并根据目标用户的性别和年龄从车辆语音资源库中匹配多种初始语音角色资源;基于人脸表情特征确定目标用户的表情信息,并根据目标用户的表情信息从多种初始语音角色资源中匹配至少一种候选语音角色资源。
在一种可能的实现方式中,若匹配到至少两种候选语音角色资源,则根据目标语音特征从该至少两种候选语音角色资源中匹配目标用户对应的目标语音角色资源包括:若匹配到至少两种候选语音角色资源,则对每种候选语音角色资源执行特征提取,得到每种候选语音角色资源对应的标准语音特征;基于预置的相似度算法分别计算目标语音特征与每种标准语音特征之间的特征相似度;根据目标语音特征与每种标准语音特征之间的特征相似度,确定目标用户对应的目标语音角色资源,其中,目标语音角色资源对应的标准语音特征与目标语音特征之间的特征相似度最大。
这样一来,首先根据人脸图像中包含生物特征(例如年龄、性别、情绪等)确定多种候选语音角色资源,进而根据用户的语音特征从该多种初始语音角色资源中与用户的声音特性最为相似的目标语音角色资源,从而提升了所匹配语音角色资源与目标用户之间的匹配度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于珠海市魅族科技有限公司,未经珠海市魅族科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211428698.8/2.html,转载请声明来源钻瓜专利网。