[发明专利]一种短视频标签抽取方法、装置、计算机设备及存储介质有效
申请号: | 201911102814.5 | 申请日: | 2019-11-12 |
公开(公告)号: | CN110825915B | 公开(公告)日: | 2022-05-13 |
发明(设计)人: | 苏映滨 | 申请(专利权)人: | 深圳墨世科技有限公司 |
主分类号: | G06F16/78 | 分类号: | G06F16/78;G06F16/735;G06F17/18 |
代理公司: | 深圳市精英专利事务所 44242 | 代理人: | 林燕云 |
地址: | 518000 广东省深圳市南山区粤海街道*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 视频 标签 抽取 方法 装置 计算机 设备 存储 介质 | ||
本发明公开了一种短视频标签抽取方法、装置、计算机设备及存储介质。该方法包括:根据短视频的描述信息从标签词库中抽取短视频的先验标签;根据用户观看短视频的先后次序,构造短视频与短视频之间的有向边;对短视频两两之间的所有入度边进行累加归一化,得到短视频之间有向边的权重;通过短视频的先验标签构建短视频的先验标签向量;通过所述短视频的先验标签向量和短视频之间有向边的权重计算得到各短视频的最终标签向量;基于所述最终标签向量,确定短视频的最终标签。该方法通过对短视频与短视频之间的关系进行标签的抽取,提高了标签的抽取效率。
技术领域
本发明涉及短视频技术领域,尤其涉及一种短视频标签抽取方法、装置、计算机设备及存储介质。
背景技术
短视频由于标题和描述的信息较少,无法从文本信息中抽取足够的标签信息,但由于从视频内容解析内容不仅计算成本高而且难度大,因此基于文本信息来抽取视频标签依然是行业的主流做法。
当前的短视频标签抽取方式主要是通过人工打标、文本分类、视频内容标签分类,所有这些技术都依赖海量的人工标注工作,其抽取方法效率较低,而且随着新内容的出现,人工标注的标签会过时以及缺少新标签,而且人工难以赋予视频标签合适的权重。
发明内容
本发明实施例提供了一种短视频标签抽取方法、装置、计算机设备及存储介质,旨在解决现有短视频标签抽取方法效率低的问题。
本发明实施例提供一种短视频标签抽取方法,其包括:
根据短视频的描述信息从标签词库中抽取短视频的先验标签;
根据用户观看短视频的先后次序,构造短视频与短视频之间的有向边;
对短视频两两之间的所有入度边进行累加归一化,得到短视频之间有向边的权重;
通过短视频的先验标签构建短视频的先验标签向量;
通过所述短视频的先验标签向量和短视频之间有向边的权重计算得到各短视频的最终标签向量;
基于所述最终标签向量,确定短视频的最终标签。
优选的,所述根据短视频的描述信息从标签词库中抽取短视频的先验标签,包括:
获取短视频自身携带的描述文本、搜索短视频所使用的搜索词以及自定义标签中的一种或几种;
将所述短视频自身携带的描述文本、搜索短视频所使用的搜索词以及自定义标签中的一种或几种与标签词库进行匹配,从标签词库中抽取出所述短视频的先验标签。
优选的,所述对短视频两两之间的所有入度边进行累加归一化,得到短视频之间有向边的权重,包括:
获取从第一短视频到第二短视频的入度边的条数,并记为第一条数;
获取从所有短视频到第二短视频的入度边的条数,并记为第二条数;
获取第一条数除以第二条数的结果,并记为所述第一短视频到第二短视频的有向边的权重。
优选的,所述通过短视频的先验标签构建短视频的先验标签向量,包括:
针对所述短视频所具有的先验标签,将所述短视频相应的先验标签向量设为1;
针对所述短视频不具有的先验标签,将所述短视频相应的先验标签向量设为0。
优选的,所述通过所述短视频的先验标签向量和短视频之间有向边的权重计算得到各短视频的最终标签向量,包括:
将所述短视频的先验标签向量以及其他短视频到所述短视频的有向边的权重进行迭代计算,得到各短视频的最终标签向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳墨世科技有限公司,未经深圳墨世科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911102814.5/2.html,转载请声明来源钻瓜专利网。