[发明专利]一种检索方法及装置在审

专利信息
申请号: 201910567616.X 申请日: 2019-06-27
公开(公告)号: CN110263198A 公开(公告)日: 2019-09-20
发明(设计)人: 王忍宝;王晓斐 申请(专利权)人: 安徽淘云科技有限公司
主分类号: G06F16/532 分类号: G06F16/532;G06F16/51
代理公司: 北京集佳知识产权代理有限公司 11227 代理人: 杨华
地址: 230088 安徽省合肥市高*** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 匹配词 候选对象 距离参数 目标词 处理对象 目标距离 检索 预设 计算距离 检索过程 检索结果 预设条件 预先计算 申请
【权利要求书】:

1.一种检索方法,其特征在于,包括:

确定待处理对象的匹配词;

计算预设的候选对象的距离参数,任意一个候选对象的距离参数依据所述匹配词对应的目标距离确定,其中,任意一个匹配词对应的目标距离为:该匹配词预设的对应词中的目标词与该匹配词的距离,所述目标词为包括在该候选对象中的词;所述对应词与所述匹配词的距离预先计算得到;

将所述距离参数满足预设条件的候选对象,作为所述待处理对象的检索结果。

2.根据权利要求1所述的方法,其特征在于,所述确定待处理对象的匹配词,包括:

提取所述待处理对象的特征;

获取预先构建的词典树,所述词典树中包括多层节点,任意一层节点中的任意一个节点为下一层节点的一个类别;

在任意一个目标节点的下一层节点中查找与所述特征的距离满足预设条件的节点,直至将最后一层节点中与所述特征距离最近的节点,作为所述待处理对象的匹配词,其中,任意一个目标节点为在同一层节点中与所述特征距离最近的节点。

3.根据权利要求2所述的方法,其特征在于,构建所述词典树的过程包括:

对样本对象的特征进行聚类,得到含有多个词的词典,任意一个词为聚类得到一个类别;

将所述词典的词作为所述词典树的最后一层的节点;

对于所述词典树其余任意一层,根据对该层的下一层的节点进行聚类,确定该层中的节点,该层中的任意一个节点为聚类得到的一个类别,所述其余任意一层为所述词典树中除了最后一层的任意一层。

4.根据权利要求1所述的方法,其特征在于,确定所述匹配词的对应词的过程,包括:

依据所述匹配词的标识,在预先创建的副词典中查找出所述匹配词的对应词;

所述副词典为记录词典中每个词以及每个词的对应词的词典,其中,任意一个词的对应词为在所述词典中与该词距离较近的前Q个词。

5.根据权利要求4所述的方法,其特征在于,创建所述副词典的过程,包括:

计算所述词典中每两个词之间的距离;

获取所述词典中每个词的对应词,任意一个词的对应词为与该词距离最近的前Q个词,所述Q为正整数;

对应存储每个词、所述每个词的对应词以及所述每个词与对应词之间的距离,得到所述副词典。

6.根据权利要求1所述的方法,其特征在于,确定所述候选对象的距离参数,包括:

对于任意一个候选对象,依据第一距离总值和/或第二距离总值确定所述候选对象的距离参数;

其中,所述第一距离总值为:各个所述匹配词对应的第一目标词的距离之和,任意一个匹配词对应的第一目标词为:所述匹配词的对应词中,包括在所述候选对象中且与所述匹配词距离最近的词;

所述第二距离总值为:各个所述匹配词对应的第二目标词的距离之和,任意一个所述匹配词对应的第二目标词为:所述匹配词的对应词中,包括在所述候选对象中且与所述匹配词距离第二近的词。

7.根据权利要求1所述的方法,其特征在于,确定所述待处理对象的候选对象,包括:

计算每个所述匹配词在所述待处理对象中的逆权重;

依据预先创建的词索引,获取每个所述匹配词在样本对象中的逆权重,其中,所述词索引存储预先计算的预设的词典中每个词对应的样本对象以及该词在其对应的样本对象中的逆权重;

依据每个所述匹配词在所述待处理对象中的逆权重以及每个所述匹配词在对应的样本对象中的逆权重,确定所述待处理对象的候选对象。

8.根据权利要求7所述的方法,其特征在于,创建所述词索引的过程,包括:

确定词典中每个词对应的样本对象,任意一个词对应的样本对象为包括该词的样本对象;

计算所述词典中的每个词在对应的样本对象中的逆权重;

对应存储所述词典中的词、所述词对应的样本对象的编号,以及所述词在对应的样本对象的逆权重,得到所述词索引。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽淘云科技有限公司,未经安徽淘云科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910567616.X/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top