[发明专利]基于图片生成视频的方法、装置、设备及存储介质有效
申请号: | 201711041184.6 | 申请日: | 2017-10-30 |
公开(公告)号: | CN107948730B | 公开(公告)日: | 2020-11-20 |
发明(设计)人: | 姚后清;施鹏;孟子扬 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | H04N21/44 | 分类号: | H04N21/44;H04N21/488;H04N21/439;G06F16/50;G06F16/33 |
代理公司: | 北京鸿德海业知识产权代理事务所(普通合伙) 11412 | 代理人: | 袁媛 |
地址: | 100085 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 图片 生成 视频 方法 装置 设备 存储 介质 | ||
1.一种基于图片生成视频的方法,其特征在于,包括:
识别出待处理的图片中的主体;
通过搜索,获取关于所述主体的问答文本;
从获取到的问答文本中选出符合要求的问答文本;
针对选出的问答文本,执行以下操作之一或任意组合:过滤掉不属于预定主题的问答文本;过滤掉问答质量评估结果低于预定阈值的问答文本;对于语义重复的问答文本进行去重处理;
根据选出的问答文本生成音频及字幕;
获取所述主体的相关图片;
根据所述相关图片、所述待处理的图片、所述音频及所述字幕生成视频。
2.根据权利要求1所述的方法,其特征在于,
所述从获取到的问答文本中选出符合要求的问答文本包括:
将获取到的各问答文本按照点击率从高到低的顺序进行排序,选出排序后处于前N位的问答文本,N为大于一的正整数。
3.根据权利要求1所述的方法,其特征在于,
所述根据选出的问答文本生成所述音频及所述字幕包括:
针对选出的每个问答文本,分别获取所述问答文本的简要文字表达;
生成所述简要文字表达对应的音频及字幕。
4.根据权利要求1所述的方法,其特征在于,
所述获取所述主体的相关图片的方式包括以下之一或全部:
通过所述主体的名称进行搜索,得到所述主体的相关图片;
通过所述待处理的图片进行搜索,得到所述主体的相关图片。
5.根据权利要求1所述的方法,其特征在于,
所述根据所述相关图片、所述待处理的图片、所述音频及所述字幕生成视频之前,进一步包括以下之一或全部:
过滤掉与所述字幕中的文字的相关性低于预定阈值的图片;
过滤掉包含预定内容的图片。
6.根据权利要求5所述的方法,其特征在于,
所述预定内容包括:模糊区域、色情内容、水印。
7.一种基于图片生成视频的装置,其特征在于,包括:主体识别单元、知识获取单元、第一生成单元、图片获取单元以及第二生成单元;
所述主体识别单元,用于识别出待处理的图片中的主体;
所述知识获取单元,用于通过搜索,获取关于所述主体的问答文本,并从获取到的问答文本中选出符合要求的问答文本;针对选出的问答文本,执行以下操作之一或任意组合:过滤掉不属于预定主题的问答文本;过滤掉问答质量评估结果低于预定阈值的问答文本;对于语义重复的问答文本进行去重处理;
所述第一生成单元,用于根据选出的问答文本生成音频及字幕;
所述图片获取单元,用于获取所述主体的相关图片;
所述第二生成单元,用于根据所述相关图片、所述待处理的图片、所述音频及所述字幕生成视频。
8.根据权利要求7所述的装置,其特征在于,
所述知识获取单元将获取到的各问答文本按照点击率从高到低的顺序进行排序,选出排序后处于前N位的问答文本,N为大于一的正整数。
9.根据权利要求7所述的装置,其特征在于,
所述第一生成单元进一步用于,
针对选出的每个问答文本,分别获取所述问答文本的简要文字表达;
生成所述简要文字表达对应的音频及字幕。
10.根据权利要求7所述的装置,其特征在于,
所述图片获取单元通过以下方式之一或全部获取所述主体的相关图片:
通过所述主体的名称进行搜索,得到所述主体的相关图片;
通过所述待处理的图片进行搜索,得到所述主体的相关图片。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711041184.6/1.html,转载请声明来源钻瓜专利网。