[发明专利]数据存储方法及装置有效
申请号: | 201510857675.2 | 申请日: | 2015-11-30 |
公开(公告)号: | CN105512230B | 公开(公告)日: | 2020-05-22 |
发明(设计)人: | 虞航仲 | 申请(专利权)人: | 北京金山安全软件有限公司 |
主分类号: | G06F16/953 | 分类号: | G06F16/953 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 马敬;项京 |
地址: | 100085 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 存储 方法 装置 | ||
本发明实施例提供的一种数据存储方法及装置,应用于服务器中,所述方法包括:获得已抓取的数据,对所述已抓取的数据建立索引;根据预设的参数项及参数项的参数特征,在获得的已抓取的数据中查找所述参数特征,根据查找结果确定所述已抓取的数据对应的参数项的参数值;将所述已抓取的数据、所述索引及确定的参数项的参数值对应保存在缓存中。可见,与现有技术相比,本方案不但将已抓取的数据、索引保存在缓存汇总,同时将已抓取的数据对应的参数项的参数值对应保存在缓存中,能丰富数据检索所依据的相关数据,从而保证后续满足差异化的检索需求。
技术领域
本发明涉及数据检索技术领域,特别是涉及数据存储方法及装置。
背景技术
为了提高检索效率,服务器通常会为数据检索所依据的数据建立索引,并将索引组织在一起,形成索引库,其中,为数据检索所依据的数据建立索引通常为:从数据检索所依据的数据中提取一些信息作为索引。举例而言:对于一篇文档,所对应的索引为从该文档中提取的文字内容或者文档的属性参数,文档的属性参数可以为:作者姓名,文档类别,等等。
现有技术中,服务器通常在获得所抓取的数据后,为所抓取的数据建立索引,进而,将所抓取的数据和索引保存至缓存中;进而,在需要执行数据检索时,基于检索方所提供的检索词,将与该检索词匹配的索引对应的已抓取的数据确定为检索结果,反馈给检索方。其中,通常通过网络爬虫来在网络上抓取数据。
但是,由于服务器所存储的数据检索过程所依据的相关数据为:所抓取的数据以及所建立的索引,这样,当对于同一个检索词而言,检索方存在差异化需求时,服务器将无法满足检索需求。
发明内容
本发明实施例的目的在于提供一种数据存储方法及装置,以丰富数据检索所依据的相关数据,从而保证后续满足差异化的检索需求。具体技术方案如下:
第一方面,本发明实施例提供了一种数据存储方法,应用于服务器中,所述方法包括:
获得已抓取的数据,对所述已抓取的数据建立索引;
根据预设的参数项及参数项的参数特征,在获得的已抓取的数据中查找所述参数特征,根据查找结果确定所述已抓取的数据对应的参数项的参数值;
将所述已抓取的数据、所述索引及确定的参数项的参数值对应保存在缓存中。
可选的,在将所述已抓取的数据、所述索引及确定的参数项的参数值对应保存在缓存中之后,所述方法还包括:
获得检索词及检索方信息;
将与所述检索词匹配的索引对应的已抓取的数据确定为初始检索结果;
根据所述检索方信息确定过滤条件,将所述初始检索结果中对应的参数项的参数值满足所述过滤条件的已抓取的数据去除,将所述初始检索结果中剩余的已抓取的数据确定为最终检索结果;
将所述最终检索结果返回至检索方。
可选的,在将所述已抓取的数据、所述索引及确定的参数项的参数值对应保存在缓存中之后,所述方法还包括:
获得检索词及过滤条件;
将与所述检索词匹配的索引对应的已抓取的数据确定为初始检索结果;
将所述初始检索结果中对应的参数项的参数值满足所述过滤条件的已抓取的数据去除,将所述初始检索结果中剩余的已抓取的数据确定为最终检索结果;
将所述最终检索结果返回至检索方。
可选的,在将所述已抓取的数据、所述索引及确定的参数项的参数值对应保存在缓存中之后,所述方法还包括:
获得数据清理条件,根据所述数据清理条件确定所需清理的已抓取的数据对应的参数项的参数值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京金山安全软件有限公司,未经北京金山安全软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510857675.2/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置