[发明专利]视频生成方法、装置、电子设备及存储介质有效
申请号: | 201911228480.6 | 申请日: | 2019-12-04 |
公开(公告)号: | CN110968736B | 公开(公告)日: | 2021-02-02 |
发明(设计)人: | 刘炫鹏 | 申请(专利权)人: | 深圳追一科技有限公司 |
主分类号: | G06F16/783 | 分类号: | G06F16/783;G06F16/78;G06K9/00;G06F40/30 |
代理公司: | 深圳市智圈知识产权代理事务所(普通合伙) 44351 | 代理人: | 吕静 |
地址: | 518057 广东省深圳市南山区粤海街道*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 生成 方法 装置 电子设备 存储 介质 | ||
本申请公开了一种视频生成方法、装置、电子设备及存储介质。所述方法包括:获取用户输入的交互信息;根据交互信息获取场景视频,所述场景视频中包括待匹配人物;获取用户的人脸信息并提取对应的人脸特征作为目标人脸特征;以所述目标人脸特征替换所述场景视频中待匹配人物的脸部特征生成待播放视频;输出所述待播放视频。从而通过视频的方式给将信息活灵活现的显示给用户,并将视频中的特定人物的脸部特征替换为目标人脸特征,增强用户的代入感,从而提升用户获取信息的使用体验。
技术领域
本申请涉及电子设备技术领域,更具体地,涉及一种视频生成方法、装置、电子设备及存储介质。
背景技术
随着科技的发展,人们的生活日益丰富,人们获取文本中的信息的方式也越来越多,越来越方便。相比于之前仅能通过阅读的方式来获取文本中的信息,现在还可以通过音频的方式来实现。
然而,通过音频的方式可以方便用户在不用看着文本的情况下,也能获取到文本信息,但较为枯燥,无趣,用户难以了解文本内容的以及环境场景相融合的具体信息,从而降低了用户获取信息的体验感。
发明内容
本申请提出了一种视频生成方法、装置、电子设备及存储介质,将信息通过视频的方式展示给用户,让用户同时从听觉和视觉上去获取信息,从而使信息能够更加生动形象地表现出来,并将用户的脸复现在视频中,以增强用户对信息的代入感,从而提升了用户获取信息的体验感。
第一方面,本申请实施例提供了一种视频生成方法,该方法包括:获取用户输入的交互信息;根据所述交互信息获取场景视频,所述场景视频中包括待匹配人物;获取用户的人脸信息并提取对应的人脸特征作为目标特征;以所述目标人脸特征替换所述场景视频中待匹配人物的脸部特征生成待播放视频;输出所述待播放视频。
可选的,根据所述交互信息获取场景视频包括:对所述交互信息进行语义理解,获取所述交互信息的语义信息;根据所述语义信息搜索相关的视频文本信息;根据所述视频文本信息生成场景视频。
可选的,根据视频文本信息生成场景视频,包括:对所述视频文本信息按照场景进行切割,获得至少一段场景文本;对所述至少一段场景文本进行语义理解,分别生成对应每一段场景文本的子场景视频;若生成一个子场景视频,将所述一个子场景视频作为所述场景视频;若生成多个子场景视频,将所述多个子场景视频合成为所述场景视频。
可选的,对所述至少一点场景文本进行语义理解,分别生成对应每一段场景文本的子场景视频,包括:从所述视频文本信息中提取语义特征,所述语义特征包括人物,地点,事件;将所述视频文本信息转换为语音信息;根据所述语义特征和所述语音信息,生成以所述人物在所述地点执行所述事件的子场景视频。
可选的,根据所述交互信息获取场景视频,包括:对所述交互信息进行语义理解,获取所述交互信息的语义信息;根据所述语义信息搜索相关的视频文件作为所述场景视频。
可选的,以所述目标人脸特征替换所述场景视频中待匹配人物的脸部特征得到待播放视频,包括:对所述场景视频进行语义理解,获取整个场景视频的主角,将所述主角作为所述场景视频中的待匹配人物;将所述待匹配人物的脸部特征替换为所述目标人脸特征。
可选的,以所述目标人脸特征替换所述场景视频中待匹配人物的脸部特征得到待播放视频,包括:
显示所述场景视频中的所有人物,以指示用户从所述所有人物中选取指定人物;获取用户所选取的指定人物,以所述指定人物作为所述场景视频中的待匹配人物;将所述待匹配人物的脸部特征替换为所述目标人脸特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳追一科技有限公司,未经深圳追一科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911228480.6/2.html,转载请声明来源钻瓜专利网。