[发明专利]一种基于业务字典权重的有序分级排序方法在审
申请号: | 201911367312.5 | 申请日: | 2019-12-26 |
公开(公告)号: | CN111209378A | 公开(公告)日: | 2020-05-29 |
发明(设计)人: | 赵成军 | 申请(专利权)人: | 航天信息股份有限公司企业服务分公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/31;G06F16/36 |
代理公司: | 北京思创大成知识产权代理有限公司 11614 | 代理人: | 高爽 |
地址: | 100086 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 业务 字典 权重 有序 分级 排序 方法 | ||
本发明提出了一种基于业务字典权重的有序分级排序方法,该方法包括:获得关键字初步顺序集合,其中每个关键字具有索引;基于专属业务字典进行索引顺序调整,获得关键字有序集合;将所述关键字有序集合中的关键字进行组合,形成不同的子集;将所述子集分级、排序,得到关键字有序组合集合。本方法基于业务字典权重,强调有序顺序性、组合分级性,并支持关键字、词、句多样化处理,从整体上多维度准确匹配结果,有效提高检索精度,尤其使专属业务领域的检索精度大幅提高,并具备扩展性、灵活性和易用性的特点。
技术领域
本发明涉及的是计算机技术检索领域,尤其涉及搜索引擎、排序、优选结果集的相关技术和方法,具体涉及一种基于业务字典权重的有序分级排序方法。
背景技术
当今社会是信息爆炸的时代,如何从海量数据搜索、提取想要的信息,是一门重要的技术。基于关键字检索、排序、选优相关技术也比较多,一般方法多是按某一个或多个关键字简单而机械的查询或者联合查询。比较好一点方法,或是加入包含权重系统等特征的字典,或是引入算法以计算权重等特征,进行结果上的排序和选优,这在一定程度上提高了的查询的匹配度。
本文提供了一种更优的检索、排序、选优的技术方法,本方法基于业务字典权重,强调有序顺序性、组合分级性,并支持关键字、词、句多样化处理,从整体上多维度准确匹配结果,有效提高检索精度,尤其使专属业务领域的检索精度大幅提高,并具备扩展性、灵活性和易用性的特点。。
发明内容
为了解决现有技术的问题,本发明提供了一种基于业务字典权重的有序分级排序方法,该方法包括:
获得关键字初步顺序集合,其中每个关键字具有索引;
基于专属业务字典进行索引顺序调整,获得关键字有序集合;
将所述关键字有序集合中的关键字进行组合,形成不同的子集;
将所述子集分级、排序,得到关键字有序组合集合。
进一步地,基于专属业务字典进行索引顺序调整包括:
获得初步权重Wi和专业权重Vi;
调整后的权重Ui为:
其中,K为专业权重Vi的权重系数。
进一步地,通过专属业务字典获取关键字的专业权重Vi;以及
通过曲线拟合的方式进行权重量化,获得初步权重Wi。
进一步地,所述子集的分级包括:
第一级,对应包括1个关键字的子集;
第二级,对应由2个关键字组合而成的子集;
……
第N级,对应由N个关键字组合而成的子集,N为自然数。
进一步地,所述关键字有序集合中子集的索引由组合该子集的关键字的索引从小到大组合而成;
同一级别的所述子集按照索引排序,索引越小排序时越靠前,查优度越高。
进一步地,从第一级到第N级,等级逐级增高,等级越高排序时越靠前,查优度越高。
进一步地,将所述关键字有序集合中的关键字分成多组,将每个组内的关键字进行组合形成不同的子集,多组关键字形成多组不同的子集。
进一步地,将多组不同的子集进行分级、排序,得到关键字有序组合集合。
进一步地,使用每一个子集元素进行查询检索,获得相应的结果集合。
进一步地,所述结果集合中的每个结果与对应的子集具有相同的分级和索引,并按照分级和索引排序。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于航天信息股份有限公司企业服务分公司,未经航天信息股份有限公司企业服务分公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911367312.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:介质滤波器复合打磨调试方法及设备
- 下一篇:一种人群运动仿真方法及装置