[发明专利]视频资源词库的管理方法及其系统有效
申请号: | 201310741040.7 | 申请日: | 2013-12-26 |
公开(公告)号: | CN103699659A | 公开(公告)日: | 2014-04-02 |
发明(设计)人: | 曹坤波;郑磊 | 申请(专利权)人: | 乐视网信息技术(北京)股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京国昊天诚知识产权代理有限公司 11315 | 代理人: | 许志勇 |
地址: | 100089 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 资源 词库 管理 方法 及其 系统 | ||
技术领域
本发明涉及信息检索技术,尤其涉及一种视频资源词库的管理方法及其系统。
背景技术
随着科技的发展,越来越多的用户通过互联网搜索并观看各种视频。由于互联网提供的视频信息十分丰富,并具有不断变化及更新的特点,随之产生了多种搜索引擎进行视频信息检索。
在关系数据库系统中,索引是检索数据最有效率的方式。但对于全网的视频搜索引擎,并不能满足其特殊要求。由于搜索引擎面对的是全网的海量视频数据,例如乐视网等大型的视频网站搜索引擎索引都是亿级甚至几千亿的网页数量,面对如此海量的视频数据,使得数据库系统很难有效的管理。
倒排索引是搜索引擎极为重要的索引方式,通过倒排索引解决海量的视频资源的存储与检索。在进行检索时,词库的质量直接影响到搜索引擎的质量,词库质量不高将直接导致降低检索效率和准确性。
综上所述,现有技术中的视频资源的词库不能够满足对于海量视频资源的检索需求,因此有必要提出改进的技术手段解决上述问题。
发明内容
本发明的主要目的在于提供一种视频资源词库的管理方法及其系统,以解决现有技术存在的视频资源的词库不能够满足对于海量视频资源的检索需求的问题。
为了解决上述问题,根据本发明的一方面,提供了一种视频资源词库的管理方法,其包括:获取字典的词汇信息作为视频资源词库的基础部分;获取视频资源的词汇信息添加至所述视频资源词库的主要部分;获取用户搜索的词汇信息添加至所述视频资源词库的补充部分;其中,所述视频资源词库由基础部分和主要部分和补充部分组成。
其中,所述获取视频资源的词汇信息添加至所述视频资源词库的主要部分包括:获取预设的视频资源库中存储的视频资源的词汇信息,并将获取的视频资源的词汇信息添加至所述视频资源词库。
其中,所述获取用户搜索的词汇信息添加至所述视频资源词库的补充部分包括:获取用户在搜索时输入的词汇信息,如果当前的视频资源词库中没有与用户输入的词汇信息相对应的词汇信息,则将用户输入的词汇信息添加至所述视频资源词库。
其中,所述方法还包括:如果当前的视频资源词库中没有与用户输入的词汇信息相对应的词汇信息,则累计所述用户输入的词汇信息及其输入的频次;当所述用户输入的相同的词汇信息的输入频次超过设定阈值时,则将所述用户输入的词汇信息添加至所述视频资源词库。
其中,所述方法还包括:根据视频资源的来源设置所述视频资源的词汇信息的词性信息,所述词性信息包括但不限于:通用词汇或专辑或用户上传视频;其中,所述视频资源词库的不同组成部分包含相应词性信息的词汇。
根据本发明的另一方面,还提供了一种视频资源词库的管理系统,其包括:第一获取模块,用于获取字典的词汇信息作为视频资源词库的基础部分;第二获取模块,用于获取视频资源的词汇信息添加至所述视频资源词库的主要部分;第三获取模块,用于获取用户搜索的词汇信息添加至所述视频资源词库的补充部分;其中,所述视频资源词库由基础部分和主要部分和补充部分组成。
其中,所述第二获取模块进一步用于获取预设的视频资源库中存储的视频资源的词汇信息,并将获取的视频资源的词汇信息添加至所述视频资源词库。
其中,所述第三获取模块进一步用于获取用户在搜索时输入的词汇信息,如果当前的视频资源词库中没有与用户输入的词汇信息相对应的词汇信息,则将用户输入的词汇信息添加至所述视频资源词库。
其中,所述系统还包括:统计模块,用于如果当前的视频资源词库中没有与用户输入的词汇信息相对应的词汇信息,则累计所述用户输入的词汇信息及其输入的频次;当所述用户输入的相同的词汇信息的输入频次超过预定阈值时,则所述第三获取模块将所述用户输入的词汇信息添加至所述视频资源词库。
其中,所述系统还包括:设置模块,用于根据视频资源的来源设置所述视频资源的词汇信息的词性信息,所述词性信息包括但不限于:通用词汇或专辑或用户上传视频;其中,所述视频资源词库的不同组成部分包含相应词性信息的词汇。
根据本发明的技术方案,通过分别获取字典的词汇、视频资源的词汇、用户搜索的词汇等多种词汇来源构成视频资源词库,使得视频资源词库具有较高的完整性和正确性,为提供高质量的搜索引擎提供了基础保证。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的视频资源词库的管理方法的流程图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于乐视网信息技术(北京)股份有限公司,未经乐视网信息技术(北京)股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310741040.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种可充式USB辅助供电装置
- 下一篇:一种通配式LED灯具