[发明专利]一种基于关键字排序的检索编码方法在审
申请号: | 201911367338.X | 申请日: | 2019-12-26 |
公开(公告)号: | CN111190948A | 公开(公告)日: | 2020-05-22 |
发明(设计)人: | 赵成军;雷艳玲;孟祥乾;郭奇;孟凡涛;王恒峰 | 申请(专利权)人: | 航天信息股份有限公司企业服务分公司 |
主分类号: | G06F16/248 | 分类号: | G06F16/248;G06F16/215;G06F16/28 |
代理公司: | 北京思创大成知识产权代理有限公司 11614 | 代理人: | 高爽 |
地址: | 100086 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 关键字 排序 检索 编码 方法 | ||
1.一种基于关键字排序的检索编码方法,其特征在于,该方法包括:
获得关键字有序集合,其中每个关键字具有索引;
将所述关键字有序集合中的关键字进行组合,形成不同的子集;
将所述子集分级、排序,得到关键字有序组合集合;
分别针对所述子集和所述关键字有序组合集合进行分级元组编码。
2.根据权利要求1所述的基于关键字排序的检索编码方法,其特征在于,所述子集的分级包括:
第一级,对应包括1个关键字的子集;
第二级,对应由2个关键字组合而成的子集;
第N级,对应由N个关键字组合而成的子集。
3.根据权利要求2所述的基于关键字排序的检索编码方法,其特征在于,所述子集的索引由组合该子集的关键字的索引从小到大组合而成;
同一级别的所述子集按照索引排序,索引越小排序时越靠前,查优度越高。
4.根据权利要求3所述的基于关键字排序的检索编码方法,其特征在于,针对所述子集的分级元组编码为:
(Lev级别,构成子集Key的序列),进一步表示为:
(n,Ki序列)
其中n为当前子集级别,i为构成子集Key的顺序索引,Key的数量和n相等。
5.根据权利要求4所述的基于关键字排序的检索编码方法,其特征在于,由各个子集的分级元组编码组成关键字有序组合集合的分级元组编码列表,其中各个子集的分级元组编码在分级元组编码列表中的分级和排序,与子集在关键字有序组合集合中的分级和排序一致。
6.根据权利要求1所述的基于关键字排序的检索编码方法,其特征在于,将所述关键字有序集合中的关键字分成多组,将每个组内的关键字进行组合形成不同的子集,多组关键字形成多组不同的子集。
7.根据权利要求6所述的基于关键字排序的检索编码方法,其特征在于,将多组不同的子集进行分级、排序,得到关键字有序组合集合。
8.根据权利要求1所述的基于关键字排序的检索编码方法,其特征在于,获得关键字有序集合包括按照用户输入关键字的次序为关键字设置索引;
针对用户输入的句子,使用分词法提取各个关键字;
为提取到的关键字分配权重系数,基于权重系数为关键字设置索引。
9.根据权利要求1所述的基于关键字排序的检索编码方法,其特征在于,使用每一个子集元素进行查询检索,获得相应的结果集合。
10.根据权利要求9所述的基于关键字排序的检索编码方法,其特征在于,所述结果集合中的每个结果与对应的子集具有相同的分级和索引,并按照分级和索引排序。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于航天信息股份有限公司企业服务分公司,未经航天信息股份有限公司企业服务分公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911367338.X/1.html,转载请声明来源钻瓜专利网。