[发明专利]视频摘要生成方法及装置在审
申请号: | 202010808917.X | 申请日: | 2020-08-12 |
公开(公告)号: | CN114078221A | 公开(公告)日: | 2022-02-22 |
发明(设计)人: | 李鹏宇 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06V20/40 | 分类号: | G06V20/40;G06V20/62;G06V40/16;G06V40/10;H04N21/44;H04N21/8549 |
代理公司: | 北京博浩百睿知识产权代理有限责任公司 11134 | 代理人: | 谢湘宁;张文华 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 摘要 生成 方法 装置 | ||
1.一种视频摘要生成方法,其特征在于,包括:
获取视频文件;
从所述视频文件中提取文字识别结果和图像识别结果;
基于所述文字识别结果和所述图像识别结果生成视频摘要。
2.根据权利要求1所述的方法,其特征在于,从所述视频文件中提取所述文字识别结果包括:
采用光学文字提取方式从所述视频文件的字幕数据中提取第一识别结果;
采用语音识别提取方式从所述视频文件的语音数据中提取第二识别结果;
对所述第一识别结果和所述第二识别结果进行自然语言处理,得到所述文字识别结果。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
记录与所述文字识别结果对应的时间信息。
4.根据权利要求3所述的方法,其特征在于,从所述视频文件中提取所述图像识别结果包括:
基于所述文字识别结果和所述时间信息,从所述视频文件中提取所述图像识别结果。
5.根据权利要求4所述的方法,其特征在于,基于所述文字识别结果和所述时间信息,从所述视频文件中提取所述图像识别结果包括:
基于所述文字识别结果获取待适配文字信息;
基于所述时间信息确定与所述待适配文字信息对应的时间点;
根据所述时间点,从所述视频文件中提取与所述待适配文字信息关联的图像内容,得到所述图像识别结果。
6.根据权利要求4所述的方法,其特征在于,基于所述文字识别结果和所述时间信息,从所述视频文件中提取所述图像识别结果包括:
基于所述文字识别结果获取待适配文字信息;
基于所述时间信息确定与所述待适配文字信息对应的时间段;
根据所述时间段,从所述视频文件中提取与所述待适配文字信息关联的图像内容,得到所述图像识别结果。
7.根据权利要求5或6所述的方法,其特征在于,从所述视频文件中提取与所述待适配文字信息关联的所述图像内容包括以下至少之一:
采用人脸识别提取方式从所述视频文件中提取与所述待适配文字信息关联的人脸识别内容;
采用人体识别提取方式从所述视频文件中提取与所述待适配文字信息关联的人体识别内容;
采用场景地点识别提取方式从所述视频文件中提取与所述待适配文字信息关联的场景地点识别内容;
采用事件行为识别提取方式从所述视频文件中提取与所述待适配文字信息关联的事件行为识别内容。
8.根据权利要求1所述的方法,其特征在于,所述视频文件包括以下之一:
时事新闻类视频文件;
科学探索类视频文件;
历史纪录类视频文件;
文艺娱乐类视频文件;
体育赛事类视频文件。
9.一种视频摘要生成方法,其特征在于,包括:
接收服务端下发的视频文件;
从所述视频文件中提取文字识别结果和图像识别结果;
基于所述文字识别结果和所述图像识别结果,在客户端上生成并展示视频摘要。
10.一种视频摘要生成方法,其特征在于,包括:
获取视频文件;
从所述视频文件中提取文字识别结果和图像识别结果;
基于所述文字识别结果和所述图像识别结果生成视频摘要,并将所述视频摘要下发至客户端,以触发所述客户端展示所述视频摘要。
11.一种视频摘要生成装置,其特征在于,包括:
获取模块,用于获取视频文件;
提取模块,用于从所述视频文件中提取文字识别结果和图像识别结果;
生成模块,用于基于所述文字识别结果和所述图像识别结果生成视频摘要。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010808917.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:扩张鞘组件
- 下一篇:钢板镀铬溶液使用寿命的检测方法