[发明专利]一种视频分类方法、装置及电子设备在审
申请号: | 201610375160.3 | 申请日: | 2016-05-31 |
公开(公告)号: | CN107451148A | 公开(公告)日: | 2017-12-08 |
发明(设计)人: | 刘德顺 | 申请(专利权)人: | 北京金山安全软件有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京市广友专利事务所有限责任公司11237 | 代理人: | 祁献民 |
地址: | 100085 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 视频 分类 方法 装置 电子设备 | ||
技术领域
本发明涉及信息分类技术,尤其涉及一种视频分类方法、装置及电子设备。
背景技术
当今社会,信息已经渗透到每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来,其中,对海量信息的准确分类,有利于人们减少浏览海量信息所需的时间,能够获取相关行业更为精确的信息,从而依据精确的信息提升决策的准确以及浏览信息的体验。
由于互联网上包含有众多视频网站,而每一视频网站包含有众多视频,为了便于用户从视频网站获取质量较高的视频,需要每一视频网站对其中的视频进行分类排名。目前的视频分类方法,主要是通过用户自动为视频进行标签分类并上传到视频网站,视频网站的运营人员依据视频标签并结合视频内容重新为视频进行分类,例如,对于用户上传包含视频标签为喜剧、娱乐、幽默的视频,运营人员经过再次分析后,可以将其归类于搞笑视频或非搞笑视频。在分类后,再结合该视频的热度以及推荐进行排名,并按照排名顺序在网站上进行推荐,例如,将一些分类下排名靠前的视频推荐至视频网站的首页,以便获得更多人们的关注,有利于首页视频的推广。
但现有的视频分类方法,由于视频网站基于运营人员的人工方式对视频进行分类,需要耗费大量的人力来进行视频筛选和分类,使得视频分类效率较低。进一步地,由于各视频网站的运营人员对视频分类时,依据主观判断分类,使得视频分类方法千差万别,不同的视频依据不同的运营人员,可能被分类到不同的分类,导致每一分类视频可能包括所有视频,使得视频分类较为混乱,从而影响用户的视频体验。
发明内容
有鉴于此,本发明实施例提供一种视频分类方法、装置及电子设备,能够提升视频分类效率,解决现有视频分类方法需要人工进行分类导致的视频分类效率较低的问题。
第一方面,本发明实施例提供一种视频分类方法,包括:
获取待分类视频;
提取所述待分类视频中的关键词,得到关键词组;
将所述关键词组依次与预先设置的各视频分类映射的分类关键词集进行匹配,分别得到与各分类关键词集相匹配的分类关键词组;
获取所述待分类视频的浏览参数,依据所述浏览参数以及所述分类关键词组计算所述待分类视频的分类质量分数;
如果所述分类质量分数超过预先设置的分类质量分数阈值,将所述待分类视频归类于所述分类关键词组对应的分类视频。
结合第一方面,在第一方面的第一种实施方式中,将所述关键词组依次与预先设置的各视频分类映射的分类关键词集进行匹配,分别得到与各分类关键词集相匹配的分类关键词组包括:
在视频分类与分类关键词集的映射关系集中,提取第一分类关键词集;
将所述关键词组与所述第一分类关键词集进行匹配,获取所述关键词组中与所述第一分类关键词集相匹配的各关键词,得到第一分类关键词组;
判断所述映射关系集中的分类关键词集是否提取完毕,如果是,结束流程,如果否,提取下一第二分类关键词集,将所述关键词组与所述第二分类关键词集进行匹配,获取所述关键词组中与所述第二分类关键词集相匹配的各关键词,得到第二分类关键词组,直至所述映射关系集中的分类关键词集被提取完毕。
结合第一方面的第一种实施方式,在第一方面的第二种实施方式中,所述获取视频分类与分类关键词集的映射关系集包括:
获取样本视频集;
按照预先设置的视频分类,对所述样本视频集中的每一样本视频进行分类,得到每一视频分类对应的分类样本视频组;
提取一分类样本视频组中每一分类样本视频包含的关键词,得到样本关键词组;
对所述样本关键词组中的关键词进行词频统计;
将词频前N位的关键词写入所述分类样本视频组映射的分类关键词集,构建视频分类与所述分类关键词集的映射关系;
判断分类样本视频组是否提取完毕,如果否,执行所述提取一分类样本视频组中每一分类样本视频包含的关键词的步骤,如果是,依据构建的映射关系形成映射关系集。
结合第一方面、第一方面的第一种或第二种实施方式,在第一方面的第三种实施方式中,利用下式计算所述分类质量分数:
F=ξ1*lg(brows)+ξ2*lg10((likes-dislikes)*(likes/(dislikes+1)))+ξ3*lg(date)+ξ4*key-words
式中,
F为分类质量分数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京金山安全软件有限公司,未经北京金山安全软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610375160.3/2.html,转载请声明来源钻瓜专利网。