[发明专利]一种信息处理方法、装置及计算机可读存储介质有效
申请号: | 201811520023.X | 申请日: | 2018-12-12 |
公开(公告)号: | CN109508406B | 公开(公告)日: | 2020-11-13 |
发明(设计)人: | 姚晓宇;郭晓锋;谭颖 | 申请(专利权)人: | 北京奇艺世纪科技有限公司 |
主分类号: | G06F16/78 | 分类号: | G06F16/78 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 莎日娜 |
地址: | 100080 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 信息处理 方法 装置 计算机 可读 存储 介质 | ||
1.一种信息处理方法,其特征在于,所述方法包括:
根据目标视频的内容,生成所述目标视频的描述性语句;
获取所述目标视频的描述性语句与所述目标视频的标题文本的第一相似度;
检测所述标题文本中是否包含关键词语;所述关键词语为属于不同领域中的类别词语;
若所述标题文本中包含所述关键词语,基于所述关键词语从预设的多个分类模型中选择目标分类模型,并根据所述目标视频包括的多个视频帧图像,利用所述目标分类模型对所述目标视频进行分类,得到所述目标视频对应的类别词语;
根据所述类别词语以及所述关键词语,计算第二相似度;
根据所述第一相似度及所述第二相似度,检测所述目标视频与所述标题文本是否相关。
2.根据权利要求1所述的方法,其特征在于,所述根据所述第一相似度及所述第二相似度,检测所述目标视频与所述标题文本是否相关,包括:
根据所述标题文本包含的词语个数,确定所述第一相似度的权重以及所述第二相似度的权重;
基于所述第一相似度、所述第一相似度的权重、所述第二相似度以及所述第二相似度的权重,计算所述标题文本与所述目标视频的相似度;
若所述标题文本与所述目标视频的相似度大于预设阈值,则确定所述标题文本与所述目标视频相关。
3.根据权利要求1所述的方法,其特征在于,所述根据目标视频的内容,生成所述目标视频的描述性语句,包括:
根据目标视频中包括的场景,将所述目标视频按照场景分割为多个视频段;
从所述多个视频段中选择一个目标视频段;
利用预设的视频检测算法,对所述目标视频段的内容进行检测,生成所述目标视频段的描述性语句,作为所述目标视频的描述性语句。
4.根据权利要求3所述的方法,其特征在于,所述从所述多个视频段中选择一个目标视频段,包括:
从所述多个视频段中任选一个视频段作为目标视频段;
或者,
确定每个视频段中包括的关键帧的数量,以及确定每个视频段中包括的关键帧的质量;将所包括的关键帧的质量满足预设条件的视频段确定为备选视频段,并将包括的关键帧的数量最多的备选视频段作为目标视频段。
5.根据权利要求1所述的方法,其特征在于,所述检测所述标题文本中是否包含关键词语,包括:
对标题文本进行分词处理,得到所述标题文本对应的多个标题词语;
对于每个标题词语,将该标题词语与预设词语库中的词语进行匹配;所述预设词语库中包括属于不同领域的类别词语;
若存在与该标题词语相匹配的类别词语,则将该标题词语确定为关键词语,并确定所述标题文本中包含关键词语。
6.根据权利要求3所述的方法,其特征在于,所述根据所述目标视频包括的多个视频帧图像,对所述目标视频进行分类,得到所述目标视频对应的类别词语,包括:
将预设数据库中与所述关键词语相匹配的类别词语所属的领域,作为所述标题文本对应的领域,得到所述标题文本对应的至少一个标题领域;
根据每个标题领域对应的分类模型的优先级,选择目标分类模型;每个标题领域对应的分类模型是利用从所述标题领域中采集的样本训练得到的;
将所述目标视频段中的帧图像组成的目标图片集,输入目标图片分类模型;
根据所述目标图片分类模型对所述目标图片集进行分类,得到所述目标视频对应的类别词语。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇艺世纪科技有限公司,未经北京奇艺世纪科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811520023.X/1.html,转载请声明来源钻瓜专利网。