[发明专利]交互方法、装置、设备和计算机可读介质在审
申请号: | 202011349707.5 | 申请日: | 2020-11-26 |
公开(公告)号: | CN112364144A | 公开(公告)日: | 2021-02-12 |
发明(设计)人: | 袁鑫;吴俊仪;蔡玉玉;张政臣;何晓冬 | 申请(专利权)人: | 北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/783;G10L13/08;G10L13/033 |
代理公司: | 北京卫智畅科专利代理事务所(普通合伙) 11557 | 代理人: | 陈佳 |
地址: | 101116 北京市北京经济技术*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 交互 方法 装置 设备 计算机 可读 介质 | ||
本公开的实施例公开了交互方法、装置、电子设备和计算机可读介质。该方法的一具体实施方式包括:获取用户通过终端输入的虚拟形象信息、物品标识和虚拟形象对应的音色信息;生成以及向终端发送物品标识对应的多个物品相关文本;响应于接收到用户通过终端在多个物品相关文本中选取的目标物品相关文本,基于音色信息和目标物品相关文本,生成目标物品相关文本对应的物品相关语音;基于虚拟形象信息和物品相关语音生成物品相关视频。该实施方式实现了虚拟形象的发音更加真实。
技术领域
本公开的实施例涉及计算机技术领域,具体涉及交互方法、装置、设备和计算机可读介质。
背景技术
随着互联技术的不断发展,虚拟形象(例如卡通人物)可以通过模拟人的声音、动作等方式来代替人完成一些工作。举例来说,可以利用虚拟主播与用户进行交互,从而可以降低人工成本。但是,相关的虚拟形象存在以下技术问题:
第一,虚拟形象声音机械且不同的虚拟形象声音同质化严重。
第二,虚拟形象难以与用户进行有效互动。
发明内容
本公开的内容部分用于以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。本公开的内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。本公开的一些实施例提出了交互方法、装置、电子设备和计算机可读介质,来解决以上背景技术部分提到的技术问题中的一项或多项。
第一方面,本公开的一些实施例提供了一种交互方法,该方法包括:获取用户通过终端输入的虚拟形象信息、物品标识和虚拟形象对应的音色信息;生成以及向终端发送物品标识对应的多个物品相关文本;响应于接收到用户通过终端在多个物品相关文本中选取的目标物品相关文本,基于音色信息和目标物品相关文本,生成目标物品相关文本对应的物品相关语音;基于虚拟形象信息和物品相关语音生成物品相关视频。
第二方面,本公开的一些实施例提供了一种交互装置,装置包括:获取单元,被配置成获取用户通过终端输入的虚拟形象信息、物品标识和虚拟形象对应的音色信息;文本生成单元,被配置成生成以及向终端发送物品标识对应的多个物品相关文本;语音生成单元,被配置成响应于接收到用户通过终端在多个物品相关文本中选取的目标物品相关文本,基于音色信息和目标物品相关文本,生成目标物品相关文本对应的物品相关语音;视频生成单元,被配置成基于虚拟形象信息和物品相关语音生成物品相关视频。
第三方面,本公开的一些实施例提供了一种电子设备,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如第一方面中任一实现方式描述的方法。
第四方面,本公开的一些实施例提供了一种计算机可读介质,其上存储有计算机程序,其中,程序被处理器执行时实现如第一方面中任一实现方式描述的方法。
本公开的上述各个实施例具有如下有益效果:虚拟形象的声音更加真实且可以实现音色定制。具体来说,发明人发现虚拟形象声音机械且同质化的原因在于:在语音生成过程中没有利用用户的音色信息。基于此,本公开的一些实施例的交互方法,通过在语音生成过程中引入音色信息,以使得最后生成视频与真人发音更加相似,从而使得虚拟形象的发音更加真实。与此同时,用户的音色信息各不相同,从而可以实现音色定制。另外,在此过程中,通过生成多个物品相关文本供用户进行选取,实现了更具针对性和个性化的文本生成,进而使得最后生成的视频也更具针对性和个性化。
附图说明
结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,元件和元素不一定按照比例绘制。
图1是根据本公开的一些实施例的交互方法的一个应用场景的示意图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司,未经北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011349707.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于ZigBee技术的语音万能遥控器
- 下一篇:一种高效智能感应灯具