[发明专利]一种短视频标签抽取方法、装置、计算机设备及存储介质有效
申请号: | 201911102814.5 | 申请日: | 2019-11-12 |
公开(公告)号: | CN110825915B | 公开(公告)日: | 2022-05-13 |
发明(设计)人: | 苏映滨 | 申请(专利权)人: | 深圳墨世科技有限公司 |
主分类号: | G06F16/78 | 分类号: | G06F16/78;G06F16/735;G06F17/18 |
代理公司: | 深圳市精英专利事务所 44242 | 代理人: | 林燕云 |
地址: | 518000 广东省深圳市南山区粤海街道*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 视频 标签 抽取 方法 装置 计算机 设备 存储 介质 | ||
1.一种短视频标签抽取方法,其特征在于,包括:
根据短视频的描述信息从标签词库中抽取短视频的先验标签;
根据用户观看短视频的先后次序,构造短视频与短视频之间的有向边;
对短视频两两之间的所有入度边进行累加归一化,得到短视频之间有向边的权重;
通过短视频的先验标签构建短视频的先验标签向量;
通过所述短视频的先验标签向量和短视频之间有向边的权重计算得到各短视频的最终标签向量;
基于所述最终标签向量,确定短视频的最终标签;
所述通过所述短视频的先验标签向量和短视频之间有向边的权重计算得到各短视频的最终标签向量,包括:
将所述短视频的先验标签向量以及其他短视频到所述短视频的有向边的权重进行迭代计算,得到各短视频的最终标签向量;
所述将所述短视频的先验标签向量以及其他短视频到所述短视频的有向边的权重进行迭代计算,得到各短视频的最终标签向量,包括:
按照如下公式计算迭代第t+1次时短视频v的最终标签向量:
其中,wi,v表示短视频i到短视频v的有向边的权重,表示短视频v在先验标签prior上的先验标签向量,kv表示短视频v的所有入度边的集合。
2.根据权利要求1所述的短视频标签抽取方法,其特征在于,所述根据短视频的描述信息从标签词库中抽取短视频的先验标签,包括:
获取短视频自身携带的描述文本、搜索短视频所使用的搜索词以及自定义标签中的一种或几种;
将所述短视频自身携带的描述文本、搜索短视频所使用的搜索词以及自定义标签中的一种或几种与标签词库进行匹配,从标签词库中抽取出所述短视频的先验标签。
3.根据权利要求1所述的短视频标签抽取方法,其特征在于,所述对短视频两两之间的所有入度边进行累加归一化,得到短视频之间有向边的权重,包括:
获取从第一短视频到第二短视频的入度边的条数,并记为第一条数;
获取从所有短视频到第二短视频的入度边的条数,并记为第二条数;
获取第一条数除以第二条数的结果,并记为所述第一短视频到第二短视频的有向边的权重。
4.根据权利要求1所述的短视频标签抽取方法,其特征在于,所述通过短视频的先验标签构建短视频的先验标签向量,包括:
针对所述短视频所具有的先验标签,将所述短视频相应的先验标签向量设为1;
针对所述短视频不具有的先验标签,将所述短视频相应的先验标签向量设为0。
5.根据权利要求1所述的短视频标签抽取方法,其特征在于,所述基于所述最终标签向量,确定短视频的最终标签,包括:
将所述短视频的各最终标签向量与预设的阈值进行比较;
若所述最终标签向量大于或等于所述阈值,则保留所述最终标签向量,若所述最终标签向量小于所述阈值,则舍弃所述最终标签向量;
将保留的各最终标签向量对应的最终标签进行组合,得到所述短视频的最终标签集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳墨世科技有限公司,未经深圳墨世科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911102814.5/1.html,转载请声明来源钻瓜专利网。