[发明专利]语音交互方法及装置、电子设备有效

申请号：	202010074175.2	申请日：	2020-01-22
公开（公告）号：	CN111292743B	公开（公告）日：	2023-09-26
发明（设计）人：	赵群;任国帅;宁洪珂	申请（专利权）人：	北京小米松果电子有限公司
主分类号：	G10L15/22	分类号：	G10L15/22;G10L15/26;G10L17/00;G10L17/22;G10L17/26;G10L25/51;G06F3/01
代理公司：	北京博思佳知识产权代理有限公司 11415	代理人：	王婵
地址：	100085 北京市***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音交互方法装置电子设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种语音交互方法，应用于终端设备，其特征在于，所述方法包括：

接收用户语音信息；

通过姿态决策模型确定与所述用户语音信息对应的预测信息，所述预测信息用于确定与用户进行交互的三维虚拟人物的姿态；

通过所述终端设备的显示装置呈现三维虚拟人物的姿态；

其中，所述姿态决策模型预先通过下述步骤训练得到：

将获取到的多个训练样本输入至姿态决策模型，每一训练样本包括交互信息和标注所述交互信息的标签信息；

所述姿态决策模型对所述每一训练样本中的交互信息进行识别，输出所述姿态决策模型预测的标签信息；

根据所述每一训练样本中标注所述交互信息的所述标签信息以及所述姿态决策模型预测的标签信息，调整所述姿态决策模型的模型参数；

其中，在接收到来自用户的消极反馈信息的情况下，删除所述标签信息和被呈现的三维虚拟人物的姿态之间的对应关系；

其中，所述通过姿态决策模型确定与所述用户语音信息对应的预测信息，包括：

基于所述用户语音信息，获得交互信息；

将所述交互信息输入预先训练完成的所述姿态决策模型；

获取所述姿态决策模型输出的标签信息作为预测信息；

根据所述标签信息和预设映射关系，得到三维虚拟人物的姿态；

其中，根据所述标签信息和预设映射关系，得到三维虚拟人物的姿态包括：

在所述标签信息的置信度大于或者等于预设阈值时，根据所述标签信息和所述预设映射关系，获取所述标签信息所对应的多个姿态中的至少一个姿态。

2.根据权利要求1所述的语音交互方法，其特征在于，根据所述标签信息和预设映射关系，得到三维虚拟人物的姿态包括：

在所述标签信息的置信度小于预设阈值时，随机获取一个或者多个姿态。

3.根据权利要求2所述的语音交互方法，其特征在于，还包括：

接收到来自用户的积极反馈信息；

根据所述用户语音信息与被呈现的三维虚拟人物的姿态之间的对应关系，更新所述姿态决策模型。

4.根据权利要求1所述的语音交互方法，其特征在于，所述三维虚拟人物的姿态包括下述至少之一：

三维虚拟人物的面部表情；

三维虚拟人物的头部动作；

三维虚拟人物的四肢动作；

三维虚拟人物的躯干动作。

5.根据权利要求1所述的语音交互方法，其特征在于，还包括：

获取用户生理特征信息；

根据所述用户生理特征信息确定三维虚拟人物。

6.根据权利要求1所述的语音交互方法，其特征在于，还包括：

获取用户生理特征信息；

通过形象决策模型确定与所述用户生理特征信息对应的三维虚拟人物。

7.根据权利要求6所述的语音交互方法，其特征在于，所述形象决策模型预先通过下述步骤训练得到：

将获取到的多个训练样本输入至形象决策模型，每一训练样本包括用户信息和标注所述用户信息的人物信息；

所述形象决策模型根据每一训练样本中的用户信息预测三维虚拟人物；

根据每一训练样本中的人物信息和所述形象决策模型预测的三维虚拟人物，调整所述形象决策模型的模型参数。

8.根据权利要求1所述的语音交互方法，其特征在于，还包括：

在所述显示装置上示出对应于所述用户语音信息的文本回复信息。

9.根据权利要求1所述的语音交互方法，其特征在于，还包括：

播放对应于所述用户语音信息的语音回复信息。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京小米松果电子有限公司，未经北京小米松果电子有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202010074175.2/1.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]语音交互方法及装置、电子设备有效

专利文献下载