[发明专利]语音交互方法及装置、电子设备有效
申请号: | 202010074175.2 | 申请日: | 2020-01-22 |
公开(公告)号: | CN111292743B | 公开(公告)日: | 2023-09-26 |
发明(设计)人: | 赵群;任国帅;宁洪珂 | 申请(专利权)人: | 北京小米松果电子有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/26;G10L17/00;G10L17/22;G10L17/26;G10L25/51;G06F3/01 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 王婵 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 交互 方法 装置 电子设备 | ||
本公开是关于一种语音交互方法及装置、电子设备。语音交互方法应用于终端设备,所述方法包括:接收用户语音信息;通过姿态决策模型确定与所述用户语音信息对应的预测信息,所述预测信息用于确定与用户进行交互的三维虚拟人物的姿态;通过所述终端设备的显示装置呈现三维虚拟人物的姿态。
技术领域
本公开涉及终端技术领域,尤其涉及一种语音交互方法及装置、电子设备。
背景技术
随着智能设备领域的不断发展,越来越多的终端设备均配置了语音功能。例如,终端设备所配置的语音助手可以与用户进行的语音交流;再例如,终端设备可以识别语音指令,并根据语音指令指示终端设备执行对应功能。但是,当前终端设备的语音功能通常是文本回复或者语音回复,导致用户在交互过程中容易感觉都枯燥、体验不佳。
发明内容
本公开提供一种语音交互方法及装置、电子设备,以解决相关技术中的不足。
根据本公开实施例的第一方面,提供一种语音交互方法,应用于终端设备,所述方法包括:
接收用户语音信息;
通过姿态决策模型确定与所述用户语音信息对应的预测信息,所述预测信息用于确定与用户进行交互的三维虚拟人物的姿态;
通过所述终端设备的显示装置呈现三维虚拟人物的姿态。
可选的,所述姿态决策模型预先通过下述步骤训练得到:
将获取到的多个训练样本输入至姿态决策模型,每一训练样本包括交互信息和标注所述交互信息的标签信息;
所述姿态决策模型对所述每一训练样本中的交互信息进行识别,输出所述姿态决策模型预测的标签信息;
根据所述每一训练样本中标注所述交互信息的所述标签信息以及所述姿态决策模型预测的标签信息,调整所述姿态决策模型的模型参数。
可选的,所述通过姿态决策模型确定与所述用户语音信息对应的预测信息,包括:
基于所述用户语音信息,获得交互信息;
将所述交互信息输入预先训练完成的所述姿态决策模型;
获取所述姿态决策模型输出的标签信息作为预测信息;
根据所述标签信息和预设映射关系,得到三维虚拟人物的姿态。
可选的,根据所述标签信息和预设映射关系,得到三维虚拟人物的姿态包括:
在所述标签信息的置信度大于或者等于预设阈值时,根据所述标签信息和所述预设映射关系,获取所述标签信息所对应的多个姿态中的至少一个姿态。
可选的,还包括:
接收到来自用户的消极反馈信息;
删除所述标签信息和被呈现的三维虚拟人物的姿态之间的对应关系。
可选的,根据所述标签信息和预设映射关系,得到三维虚拟人物的姿态包括:
在所述标签信息的置信度小于预设阈值时,随机获取一个或者多个姿态。
可选的,还包括:
接收到来自用户的积极反馈信息;
根据所述用户语音信息与被呈现的三维虚拟人物的姿态之间的对应关系,更新所述姿态决策模型。
可选的,所述三维虚拟人物的姿态包括下述至少之一:
三维虚拟人物的面部表情;
三维虚拟人物的头部动作;
三维虚拟人物的四肢动作;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京小米松果电子有限公司,未经北京小米松果电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010074175.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用户终端设备及天线选择方法
- 下一篇:视频的推荐方法及装置