[发明专利]实现视听类产品内容摘要自动提取生成的系统及方法有效

专利信息
申请号: 201310698604.3 申请日: 2013-12-18
公开(公告)号: CN103646094B 公开(公告)日: 2017-05-31
发明(设计)人: 董建磊;张树民 申请(专利权)人: 上海紫竹数字创意港有限公司
主分类号: G06F17/30 分类号: G06F17/30;G06F17/27
代理公司: 上海智信专利代理有限公司31002 代理人: 王洁,郑暄
地址: 200240 上海市闵行*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 实现 视听 类产品 内容摘要 自动 提取 生成 系统 方法
【权利要求书】:

1.一种实现视听类产品内容摘要自动提取生成的系统,其特征在于,所述的系统包括:

视听类媒体解码模块,用以对视听类媒体进行解码并提取音频流、视频流和已编码的文本流;

语音处理模块,用以在所述的音频流中提取音频特征并对符合语音特征的特征进行语音识别;

文本抽取模块,用以检测并确认所述的视听类媒体中字幕的位置并根据语音识别结果对字幕进行分割和识别以提取文本关键词,且具体进行以下处理:

(a)所述的文本抽取模块检测所述的视听类媒体中的字幕并根据多帧检测结果确定字幕的位置;

(b)所述的文本抽取模块根据所述的语音处理模块的语音识别结果进行字幕语音同步;

(c)所述的文本抽取模块根据字幕语音同步结果选取识别概率最高的文字为文本关键词;

场景分割模块,用以根据音频特征和视频特征提取各镜头间的关键帧并将相似度大的关键帧聚合为场景;

场景语义标注和摘要生成模块,用以根据所述的文本关键词生成所述的视听类媒体的文本摘要并根据聚合的场景生成所述的视听类媒体的视频摘要。

2.一种基于权利要求1所述的系统实现视听类产品内容摘要自动提取生成的方法,其特征在于,所述的方法包括以下步骤:

(1)所述的视听类媒体解码模块对视听类媒体进行解码并提取音频流、视频流和已编码的文本流;

(2)所述的语音处理模块在所述的音频流中提取音频特征并对符合语音特征的特征进行语音识别;

(3)所述的文本抽取模块检测并确认所述的视听类媒体中字幕的位置并根据语音识别结果对字幕进行分割和识别以提取文本关键词;包括以下步骤:

(31)所述的文本抽取模块检测所述的视听类媒体中的字幕并根据多帧检测结果确定字幕的位置;

(32)所述的文本抽取模块根据所述的语音处理模块的语音识别结果进行字幕语音同步;

(33)所述的文本抽取模块根据字幕语音同步结果选取识别概率最高的文字为文本关键词;

(4)所述的场景分割模块根据音频特征和视频特征提取各镜头间的关键帧并将相似度大的关键帧聚合为场景;

(5)所述的场景语义标注和摘要生成模块根据所述的文本关键词生成所述的视听类媒体的文本摘要并根据聚合的场景生成所述的视听类媒体的视频摘要。

3.根据权利要求2所述的实现视听类产品内容摘要自动提取生成的方法,其特征在于,所述的场景分割模块根据音频特征和视频特征提取各镜头间的关键帧并将相似度大的关键帧聚合为场景,包括以下步骤:

(41)所述的场景分割模块分析所述的视频流的视频特征;

(42)所述的场景分割模块根据所述的音频特征和视频特征对所述的视频流提取关键帧;

(43)所述的场景分割模块计算各镜头间的关键帧的相似度并将相似度大的关键帧聚合为场景。

4.根据权利要求3所述的实现视听类产品内容摘要自动提取生成的方法,其特征在于,所述的场景分割模块计算各镜头间的关键帧的相似度,具体为:

所述的场景分割模块根据各镜头间的关键帧的音频背景特征和视频特征计算各关键帧的相似度。

5.根据权利要求2所述的实现视听类产品内容摘要自动提取生成的方法,其特征在于,所述的场景语义标注和摘要生成模块根据所述的文本关键词生成所述的视听类媒体的文本摘要并根据聚合的场景生成所述的视听类媒体的视频摘要,包括以下步骤:

(51)所述的场景语义标注和摘要生成模块提取所述的文本关键词并计算各个文本关键词出现的频率和在局部时间帧序列上的分布;

(52)所述的场景语义标注和摘要生成模块计算一聚合的场景内的局部场景关键词并计算该局部场景关键词出现的频率和在局部时间帧序列上的分布;

(53)所述的场景语义标注和摘要生成模块选择所述的文本关键词中与所述的局部场景关键词距离最近的语句作为对聚合的场景的语义标注语句;

(54)所述的场景语义标注和摘要生成模块将距离所述的语义标注语句出现的位置最近的关键帧定为语义关键帧;

(55)所述的场景语义标注和摘要生成模块基于所述的语义关键帧生成视频摘要并基于该聚合的场景的语义标注语句生成文本摘要。

6.根据权利要求5所述的实现视听类产品内容摘要自动提取生成的方法,其特征在于,所述的步骤(53)和(54)之间,还包括以下步骤:

(531)所述的场景语义标注和摘要生成模块判断相邻的聚合的场景的语义标注语句之间的相似度是否大于系统预设值,如果是,则继续步骤(532),否则继续步骤(54);

(532)将相邻的聚合的场景进一步聚合生成一场景,然后继续步骤(52)。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海紫竹数字创意港有限公司,未经上海紫竹数字创意港有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201310698604.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top