[发明专利]一种视频分类方法、装置及电子设备在审
申请号: | 201610375160.3 | 申请日: | 2016-05-31 |
公开(公告)号: | CN107451148A | 公开(公告)日: | 2017-12-08 |
发明(设计)人: | 刘德顺 | 申请(专利权)人: | 北京金山安全软件有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京市广友专利事务所有限责任公司11237 | 代理人: | 祁献民 |
地址: | 100085 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 视频 分类 方法 装置 电子设备 | ||
1.一种视频分类方法,其特征在于,包括:
获取待分类视频;
提取所述待分类视频中的关键词,得到关键词组;
将所述关键词组依次与预先设置的各视频分类映射的分类关键词集进行匹配,分别得到与各分类关键词集相匹配的分类关键词组;
获取所述待分类视频的浏览参数,依据所述浏览参数以及所述分类关键词组计算所述待分类视频的分类质量分数;
如果所述分类质量分数超过预先设置的分类质量分数阈值,将所述待分类视频归类于所述分类关键词组对应的分类视频。
2.根据权利要求1所述的视频分类方法,其特征在于,所述将所述关键词组依次与预先设置的各视频分类映射的分类关键词集进行匹配,分别得到与各分类关键词集相匹配的分类关键词组包括:
在视频分类与分类关键词集的映射关系集中,提取第一分类关键词集;
将所述关键词组与所述第一分类关键词集进行匹配,获取所述关键词组中与所述第一分类关键词集相匹配的各关键词,得到第一分类关键词组;
判断所述映射关系集中的分类关键词集是否提取完毕,如果是,结束流程,如果否,提取下一第二分类关键词集,将所述关键词组与所述第二分类关键词集进行匹配,获取所述关键词组中与所述第二分类关键词集相匹配的各关键词,得到第二分类关键词组,直至所述映射关系集中的分类关键词集被提取完毕。
3.根据权利要求2所述的视频分类方法,其特征在于,所述获取视频分类与分类关键词集的映射关系集包括:
获取样本视频集;
按照预先设置的视频分类,对所述样本视频集中的每一样本视频进行分类,得到每一视频分类对应的分类样本视频组;
提取一分类样本视频组中每一分类样本视频包含的关键词,得到样本关键词组;
对所述样本关键词组中的关键词进行词频统计;
将词频前N位的关键词写入所述分类样本视频组映射的分类关键词集,构建视频分类与所述分类关键词集的映射关系;
判断分类样本视频组是否提取完毕,如果否,执行所述提取一分类样本视频组中每一分类样本视频包含的关键词的步骤,如果是,依据构建的映射关系形成映射关系集。
4.根据权利要求1至3任一项所述的视频分类方法,其特征在于,利用下式计算所述分类质量分数:
F=ξ1*lg(brows)+ξ2*lg10((likes-dislikes)*(likes/(dislikes+1)))+ξ3*lg(date)+ξ4*key-words
式中,
F为分类质量分数;
ξ1为浏览量权重系数;
brows为浏览量;
ξ2为喜欢数权重系数;
likes为喜欢数;
dislikes为不喜欢数;
ξ3为日期权重系数;
date为发布日期距离当前日期的天数;
ξ4为分类关键词组权重系数;
key-words为分类关键词组包含的分类关键词数。
5.根据权利要求4所述的视频分类方法,其特征在于,所述浏览量权重系数为0.25、所述喜欢数权重系数为0.0.375、所述日期权重系数为0.1,以及,所述分类关键词组权重系数为0.025。
6.根据权利要求1至3任一项所述的视频分类方法,其特征在于,所述方法还包括:
在归类的所述分类关键词组对应的分类视频中,按照所述分类质量分数进行排序,获取排序前M位的分类质量分数对应的视频,推荐至预先设置的视频网站的首页。
7.根据权利要求6所述的视频分类方法,其特征在于,所述方法还包括:
获取注册所述分类关键词组对应的分类视频的用户集,将排序前M位的分类质量分数对应的视频向获取的用户集中的各用户推送。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京金山安全软件有限公司,未经北京金山安全软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610375160.3/1.html,转载请声明来源钻瓜专利网。