[发明专利]一种信息处理方法、装置及计算机可读存储介质有效
申请号: | 201811520023.X | 申请日: | 2018-12-12 |
公开(公告)号: | CN109508406B | 公开(公告)日: | 2020-11-13 |
发明(设计)人: | 姚晓宇;郭晓锋;谭颖 | 申请(专利权)人: | 北京奇艺世纪科技有限公司 |
主分类号: | G06F16/78 | 分类号: | G06F16/78 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 莎日娜 |
地址: | 100080 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 信息处理 方法 装置 计算机 可读 存储 介质 | ||
本发明提供了一种信息处理方法、装置及计算机可读存储介质,属于计算机技术领域。该方法可以根据目标视频的内容,生成目标视频的描述性语句,然后获取目标视频的描述性语句与目标视频的标题文本的第一相似度,最后,可以根据第一相似度检测目标视频与标题文本是否相关。本发明实施例中,无需进行人工检测即可确定出视频与其标题文本是否相关,节省了检测成本,同时避免了由于受到个人主观性的影响,导致检测结果存在偏差的问题,进而提高检测的准确率。
技术领域
本发明属于计算机技术领域,特别是涉及一种信息处理方法、装置及计算机可读存储介质。
背景技术
随着网络技术的不断发展,用户可以将自己制作的视频上传至视频平台,以供其他用户观看。为了方便其他用户了解所上传视频的内容,用户往往会为视频增加视频标题,使得其他用户能够通过视频标题快速的了解该视频的大致内容,进而决定是否观看该视频。但是,有些用户为了提高自己所上传视频的点击率,会为视频设置具有吸引力,但是与视频内容相差较远的标题,以此恶意吸引其他用户。
为了避免视频标题与内容不符,导致其他用户被欺骗的问题,现有技术中,往往是采用人工审核的方式,检测上传的视频与视频标题的相关性,如果相关性较低,则禁止上传该视频。但是,人工检测的成本较高,且受到个人主观性的影响,人为检测视频与视频标题的相关性的准确率也较低。
发明内容
本发明提供一种信息处理方法、装置及计算机可读存储介质,用以在一定程度上解决人工检测成本较高以及准确率较低的问题。
依据本发明的第一方面,提供了一种信息处理方法,该方法包括:
根据目标视频的内容,生成所述目标视频的描述性语句;
获取所述目标视频的描述性语句与所述目标视频的标题文本的第一相似度;
根据所述第一相似度,检测所述目标视频与所述标题文本是否相关。
可选的,所述根据所述第一相似度,检测所述目标视频与所述标题文本是否相关之前,所述方法还包括:
检测所述标题文本中是否包含关键词语;所述关键词语为属于不同领域中的类别词语;
若所述标题文本中包含关键词语,则根据所述目标视频包括的多个视频帧图像,对所述目标视频进行分类,得到所述目标视频对应的类别词语;
根据所述类别词语以及所述关键词语,计算第二相似度;
所述根据所述第一相似度,检测所述目标视频与所述标题文本是否相关,包括:
根据所述第一相似度及所述第二相似度,检测所述目标视频与所述标题文本是否相关。
可选的,所述根据所述第一相似度及所述第二相似度,检测所述目标视频与所述标题文本是否相关,包括:
根据所述标题文本包含的词语个数,确定所述第一相似度的权重以及所述第二相似度的权重;
基于所述第一相似度、所述第一相似度的权重、所述第二相似度以及所述第二相似度的权重,计算所述标题文本与所述目标视频的相似度;
若所述标题文本与所述目标视频的相似度大于预设阈值,则确定所述标题文本与所述目标视频相关。
可选的,所述根据目标视频的内容,生成所述目标视频的描述性语句,包括:
根据目标视频中包括的场景,将所述目标视频按照场景分割为多个视频段;
从所述多个视频段中选择一个目标视频段;
利用预设的视频检测算法,对所述目标视频段的内容进行检测,生成所述目标视频段的描述性语句,作为所述目标视频的描述性语句。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇艺世纪科技有限公司,未经北京奇艺世纪科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811520023.X/2.html,转载请声明来源钻瓜专利网。