[发明专利]倒排索引存储方法及其系统有效
申请号: | 201310741178.7 | 申请日: | 2013-12-26 |
公开(公告)号: | CN103678697A | 公开(公告)日: | 2014-03-26 |
发明(设计)人: | 曹坤波;郑磊 | 申请(专利权)人: | 乐视网信息技术(北京)股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京国昊天诚知识产权代理有限公司 11315 | 代理人: | 许志勇 |
地址: | 100089 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 索引 存储 方法 及其 系统 | ||
技术领域
本发明涉及信息检索技术,尤其涉及一种视频资源数据的倒排索引存储方法及其系统。
背景技术
随着科技的发展,越来越多的用户通过互联网搜索并观看各种视频。由于互联网提供的视频信息十分丰富,并具有不断变化及更新的特点,随之产生了多种搜索引擎进行视频信息检索。
目前的搜索引擎一般使用两种技术实现信息检索:一是使用网站分类技术,即把网站进行树状归类,登陆的网站属于至少一个类别,对每个站点都有简略的描述。二是使用全文检索技术,全文检索技术处理的对象是文本,它能够对大量文档(例如互联网上的大量网页)建立由字(词)到文档的倒排索引,在此基础上,当用户使用关键词来对文档进行查询时,系统将给用户返回含有该关键词的文档。建立这种倒排索引的好处是不必为每个用户查询都检查一遍所有的文档。
但是,在实际应用中终端设备通过多种渠道访问互联网,在提供索引服务时,如果不考虑终端设备的访问渠道、对所有的终端设备提供一致的索引服务,则会降低检索效率,因此有必要提出改进的技术方案解决上述问题。
发明内容
本发明的主要目的在于提供一种倒排索引存储方法及其系统,以解决现有技术存在的不区分终端设备的访问渠道、对访问的所有终端设备提供一致的索引服务导致降低检索效率的问题。
为了解决上述问题,根据本发明的一方面,提供了一种倒排索引存储方法,其包括:建立视频文件的倒排索引文件;提供多个索引服务器,将所述倒排索引文件同步存储至多个索引服务器,并根据终端设备的访问渠道分别设置对应的索引服务器提供索引服务。
其中,所述根据终端设备的访问渠道分别设置对应的索引服务器提供索引服务,包括:根据终端设备的类型分别设置对应的索引服务器提供索引服务;或者,根据终端设备使用的运营商平台分别设置对应的索引服务器提供索引服务。
其中,所述方法还包括:接收倒排索引文件的更新文件,根据终端设备的访问渠道使用预先设置的更新方式将所述倒排索引的更新文件发布给对应的索引服务器。
其中,所述方法还包括:记录终端设备的访问请求的数量;当对于同一个倒排索引文件的访问请求的数量超过预设阈值时,提供扩容索引服务器用于接收终端设备的访问请求。
其中,所述建立视频文件的倒排索引文件,包括:通过预设的分词方式对视频文件信息进行分词处理得到关键词;建立所述关键词与具有所述关键词的视频文件信息之间的索引关系,从而建立视频文件的倒排索引文件。
根据本发明的另一方面,还提供一种倒排索引存储系统,其包括:建立模块,用于建立视频文件的倒排索引文件;存储模块,用于将所述倒排索引文件同步存储至提供的多个索引服务器;设置模块,用于根据终端设备的访问渠道分别设置对应的索引服务器提供索引服务。
其中,所述设置模块包括:第一设置模块,用于根据终端设备的类型分别设置对应的索引服务器提供索引服务;第二设置模块,用于根据终端设备使用的运营商平台分别设置对应的索引服务器提供索引服务。
其中,所述系统还包括:更新模块,用于接收到倒排索引文件的更新文件后,根据终端设备的访问渠道使用预先设置的更新方式将所述倒排索引的更新文件发布给对应的索引服务器。
其中,所述系统还包括:记录模块,用于记录终端设备的访问请求的数量;管理模块,用于当对于同一个倒排索引文件的访问请求的数量超过预设阈值时,提供扩容索引服务器用于接收终端设备的访问请求。
其中,所述建立模块包括:关键词获取模块,用于通过预设的分词方式对视频文件信息进行分词处理得到关键词;倒排索引建立模块,用于建立所述关键词与具有所述关键词的视频文件信息之间的索引关系,从而建立视频文件的倒排索引文件。
根据本发明的技术方案,通过将倒排索引文件同步存储至多个索引服务器,并根据终端设备的访问渠道分别设置对应的索引服务器提供索引服务,在接收到终端设备访问倒排索引文件的访问请求时,能够根据终端设备的访问渠道设置对应的索引服务器检索得到倒排索引信息,从而提高了访问请求的效率和速度。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的倒排索引存储方法的流程图;
图2是根据本发明一个实施例的倒排索引存储系统的结构框图;
图3是根据本发明另一实施例的倒排索引存储系统的结构框图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于乐视网信息技术(北京)股份有限公司,未经乐视网信息技术(北京)股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310741178.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:服务器中的数据合并方法及系统
- 下一篇:一种基于导航信息检索的中文分词方法