[发明专利]一种视频基因的生成方法和装置有效
申请号: | 201610670921.8 | 申请日: | 2016-08-15 |
公开(公告)号: | CN106294797B | 公开(公告)日: | 2019-10-18 |
发明(设计)人: | 崔玉斌;宋征;赵明 | 申请(专利权)人: | 北京数码视讯科技股份有限公司 |
主分类号: | G06F16/783 | 分类号: | G06F16/783 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 唐维虎 |
地址: | 100089 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种视频基因的生成方法和装置,其中,该方法包括:获取与当前视频相关的源数据;其中,源数据包括与当前视频相关的网页文本、当前视频内的字幕文本和当前视频对应的音频数据中的一种或多种;按照源数据中单体数据出现的频率从源数据中提取当前视频的特征数据;根据提取到的特征数据和预先建立的视频基因词库确定当前视频的基因词;其中,预先建立的视频基因词库包括样本视频、样本视频的特征数据和样本视频的基因词;其中,样本视频的特征数据包括字幕文本的向量化词语和音频数据的特征数据。本发明可以更加细化和精确地描述视频特征。 | ||
搜索关键词: | 一种 视频 基因 生成 方法 装置 | ||
【主权项】:
1.一种视频基因的生成方法,其特征在于,包括:获取与当前视频相关的源数据;其中,所述源数据包括与所述当前视频相关的网页文本、所述当前视频内的字幕文本和所述当前视频对应的音频数据中的一种或多种;按照所述源数据中单体数据出现的频率从所述源数据中提取所述当前视频的特征数据;其中,对于所述网页文本和所述字幕文本,所述单体数据为词语,对于所述音频数据,所述单体数据为音频单元;根据提取到的所述特征数据和预先建立的视频基因词库确定所述当前视频的基因词;其中,所述预先建立的视频基因词库包括样本视频、所述样本视频的特征数据和所述样本视频的基因词;其中,所述样本视频的特征数据包括所述字幕文本的向量化词语和所述音频数据的特征数据;根据提取到的所述特征数据和预先建立的视频基因词库确定所述当前视频的基因词,包括:当所述源数据为所述字幕文本或所述音频数据时,将所述特征数据和预先建立的视频基因词库进行匹配操作,根据匹配成功的所述特征数据确定所述特征数据对应的样本视频;将所述样本视频的基因词确定为所述当前视频的候选基因词;将所述候选基因词输入预设的神经网络,生成所述当前视频的基因词;对于所述当前视频,当通过网页文本没有获取到符合预设标准的基因词时,通过所述当前视频内的所述字幕文本获取基因词;当所述当前视频没有字幕或者通过所述字幕文本没有获取到符合预设标准的基因词时,再通过所述当前视频内的音频数据获取基因词。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京数码视讯科技股份有限公司,未经北京数码视讯科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610670921.8/,转载请声明来源钻瓜专利网。