[发明专利]倒排索引方法及装置在审
申请号: | 201810346228.4 | 申请日: | 2018-04-18 |
公开(公告)号: | CN108563762A | 公开(公告)日: | 2018-09-21 |
发明(设计)人: | 梁希云;秦锋剑 | 申请(专利权)人: | 小草数语(北京)科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 张润 |
地址: | 100089 北京市海淀区西小*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 检索条件 二级索引 定向条件 一级索引 倒排索引 检索结果 广告 匹配 倒排索引结构 内存占用量 过滤条件 检索效率 查询 检索 | ||
本发明提出一种倒排索引方法及装置,其中方法包括:获取检索条件;检索条件中包括:至少一个待检索的关键词;根据检索条件查询倒排索引结构,获取与检索条件匹配的一级索引词;根据检索条件查询一级索引词对应的二级索引数据,获取二级索引数据中与检索条件匹配的二级索引词;根据二级索引词对应的二级倒排数据,确定检索结果,从而能够避免将所有的广告定向条件作为一级索引词,也避免将部分广告定向条件作为对检索结果的过滤条件,而是将部分广告定向条件作为一级索引词,部分广告定向条件作为二级索引词,在提高检索效率的同时,确保较低的内存占用量。
技术领域
本发明涉及数据处理技术领域,尤其涉及一种倒排索引方法及装置。
背景技术
目前,搜索引擎、定向广告播放系统等系统中采用的倒排索引结构一般为一级倒排索引结构。例如,在定向广告播放系统中,一种解决方法是,将所有的广告定向条件作为一级索引词,与广告定向条件匹配的广告的相关信息作为一级倒排数据。然而这种解决方法中,随着广告定向条件的增加,倒排索引结构的内存占用量会极大的增加。另一种解决方法是,将一部分广告定向条件作为一级索引词,采用另一部分广告定向条件对检索结果进行过滤。然而这种解决方法中,过滤性能是低效的,影响检索效率。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明的第一个目的在于提出一种倒排索引方法,用于解决现有技术中倒排索引结构难以同时满足较低的内存占用量和较高的检索效率的问题。
本发明的第二个目的在于提出一种倒排索引装置。
本发明的第三个目的在于提出另一种倒排索引装置。
本发明的第四个目的在于提出一种非临时性计算机可读存储介质。
本发明的第五个目的在于提出一种计算机程序产品。
为达上述目的,本发明第一方面实施例提出了一种倒排索引方法,包括:
获取检索条件;所述检索条件中包括:至少一个待检索的关键词;
根据所述检索条件查询倒排索引结构,获取与所述检索条件匹配的一级索引词;
根据所述检索条件查询一级索引词对应的二级索引数据,获取所述二级索引数据中与所述检索条件匹配的二级索引词;
根据所述二级索引词对应的二级倒排数据,确定检索结果。
进一步的,所述倒排索引结构中包括:
一级索引词,以及对应的一级倒排数据和二级索引数据;
所述一级倒排数据中包括:与所述一级索引词相关的各个对象的信息;
所述二级索引数据中包括:各个二级索引词以及对应的二级倒排数据。
进一步的,所述二级索引词对应的二级倒排数据中包括:所述一级倒排数据中与所述二级索引词相关的各个对象的信息。
进一步的,所述二级倒排数据中,所述对象的信息,为所述对象在所述一级倒排数据中的序列号。
进一步的,所述根据所述二级索引词对应的二级倒排数据,确定检索结果,包括:
获取所述二级倒排数据中各个对象的序列号;
根据所述各个对象的序列号,查询所述一级倒排数据,获取所述一级倒排数据中所述各个对象的信息;
根据所述一级倒排数据中所述各个对象的信息,确定检索结果。
进一步的,所述二级索引数据中还包括:序列号的字节类型;所述序列号的字节类型,根据所述一级倒排数据中对象的数量确定;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于小草数语(北京)科技有限公司,未经小草数语(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810346228.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种信息记录方法及装置
- 下一篇:铁路信号设备图形显示方法、装置及移动终端