[发明专利]基于数字人的人机交互方法、装置、电子设备及存储介质在审

申请号：	202111214201.8	申请日：	2021-10-18
公开（公告）号：	CN113901190A	公开（公告）日：	2022-01-07
发明（设计）人：	刘致远;田升;穆少垒	申请（专利权）人：	深圳追一科技有限公司
主分类号：	G06F16/332	分类号：	G06F16/332;G06F16/33;G06F16/783;G06F40/30;G06F3/01;G06N3/04;G06N3/08;G06N5/04
代理公司：	深圳智汇远见知识产权代理有限公司 44481	代理人：	蒋学超
地址：	518057 广东省深圳市南山区粤海街道***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于数字人机交互方法装置电子设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明实施例涉及一种基于数字人的人机交互方法、装置、电子设备及存储介质，方法包括：获取用户输入的控制指令；对所述控制指令进行识别，得到待播报的目标音频；依据所述目标音频生成数字人视频并播放，以通过数字人对所述目标音频进行播报。由此，可以实基于数字人的人机交互，在基于数字人的人机交互场景下，电子设备在播放音频的同时，还能够以实时视频流形式渲染出虚拟的数字人，且该数字人能够表现出与输出音频相应的表情和肢体动作，使得用户从感观上的体验为数字人在对音频进行播报，从而能够提升用户的人机交互体验。

技术领域

本发明实施例涉及数字人技术领域，尤其涉及一种基于数字人的人机交互方法、装置、电子设备及存储介质。

背景技术

人机交互，也称人机互动，是以一定的交互方式，为完成确定任务的人与系统之间的信息交换过程。系统可以是各种各样的机器，也可以是计算机化的系统和软件。例如，用户可通过输出语音控制指令，控制系统播放相应的短视频(或视频)。

发明内容

本发明实施例提供一种基于数字人的人机交互方法、装置、电子设备及存储介质，以实现基于数字人的人机交互，使得电子设备在播放音频的同时，能够以实时视频流形式渲染出虚拟的数字人，使得用户从感观上的体验为数字人在对音频进行播报，以能够提升用户的人机交互体验。

第一方面，本发明实施例提供一种基于数字人的人机交互方法，包括：

获取用户输入的控制指令；

对所述控制指令进行识别，得到待播报的目标音频；

依据所述目标音频生成数字人视频并播放，以通过数字人对所述目标音频进行播报。

在一个可能的实施方式中，所述获取用户输入的控制指令，包括：

通过音频采集装置获取用户输入的控制指令，所述控制指令为语音控制指令；或者，