[发明专利]一种基于结构化数据的关联词语检索方法在审

专利信息
申请号: 202011093597.0 申请日: 2020-10-14
公开(公告)号: CN112163003A 公开(公告)日: 2021-01-01
发明(设计)人: 黄晓明;韦天贵;朱伟东 申请(专利权)人: 广州学而优信息技术有限公司
主分类号: G06F16/2455 分类号: G06F16/2455;G06F16/242;G06F16/2458;G06F16/248
代理公司: 暂无信息 代理人: 暂无信息
地址: 510000 广东省广州市高新技术产业开发区揽月路*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 结构 数据 关联 词语 检索 方法
【说明书】:

发明公开了一种基于结构化数据的关联词语检索方法,包括如下步骤:S1、设定关联等级阈值;S2、输入检索词语;S3、定义词语关联空间;S4、划分关联等级;S5、关联词语分组;S6、关联词语呈现。本发明提供的一种基于结构化数据的关联词语检索方法,与传统的关联词语检索方法相比,本发明在输入词与其相关的同义词、近义词、反义词、相近词、拓展词、同音词、模糊音词语、相关图片、相关视频以及含有该词语的相关公开文献进行等级划分后,再次将除输入词以外的词语进行等级划分,并根据优先等级分组展示给用户,一定程度上提高了用户搜索后结果的准确性。

技术领域

本发明属于关联词语检索领域,更具体地说,尤其涉及一种基于结构化数据的关联词语检索方法。

背景技术

结构化数据,简单来说就是数据库。结合到典型场景中更容易理解,比如企业ERP、财务系统;医疗HIS数据库;教育一卡通;政府行政审批;其他核心数据库等。这些应用需要哪些存储方案呢?基本包括高速存储应用需求、数据备份需求、数据共享需求以及数据容灾需求,随着英特网上信息数据量的剧增,搜索引擎为了更好的服务于用户,就有必要采取辅助手段来提高搜索效率,而智能推荐检索关联词语就是多种辅助手段中的一种。

目前,现有技术大多是将输入词与其相关的同义词、近义词、反义词、相近词、拓展词、同音词、模糊音词语、相关图片、相关视频以及含有该词语的相关公开文献等进行等级划分,并展示给用户,但是对于输入词的同义词、近义词、反义词、相近词、拓展词、同音词、模糊音词语、相关图片、相关视频以及含有该词语的相关公开文献等并未进行细致划分,这就一定程度上影响了用户搜索的准确性,因此,我们提出一种基于结构化数据的关联词语检索方法。

发明内容

本发明的目的是为了解决现有技术中存在的缺点,而提出的一种基于结构化数据的关联词语检索方法。

为实现上述目的,本发明提供如下技术方案:

一种基于结构化数据的关联词语检索方法,包括如下步骤:

S1、设定关联等级阈值,所述关联等级阈值设定根据关联词语的出现的密度进行设定,且阈值范围为≥5%,即,100个词语当中至少出现5次关联词语;

S2、输入检索词语,将需要检索的一组词语输入或者词语集合输入,词语集合之间需输入分隔符;

S3、定义词语关联空间,所述词语的关联空间包括同义词、近义词、反义词、相近词、拓展词、同音词、模糊音词语、相关图片、相关视频以及含有该词语的相关公开文献;

S4、划分关联等级,分别基于每一个目标关联词语出现的密度,计算每一个目标关联词语与所述检索词语之间的关联度,并根据其关联度划分出关联等级,所述关联等级包括A、B、C、D、E五个等级,且中A级为最高等级,所述关联的划分根据关联词语出现的密度进行划分,关联词语出现的密度越高,其关联等级越高;

S5、关联词语分组,将关联度达到设定阈值的目标词语、图片、视频以及文献,作为检索关联词语进行分组,所述分组依据其关联密度从高到低进行分组,且每组不超过十条关联度达到设定阈值的目标词语、图片、视频以及文献;

S6、关联词语呈现,将分好组的目标词语、图片、视频以及文献与组为单位呈现给用户。

优选的,步骤S3所述的关联空间采用对比计算以及演绎计算的方式对输入词语的程度关系词语进行归纳,所述程度关系词语包括:主副关系词语、成员关系词语、类似关系词语、对立关系词语、并列关系词语。

优选的,所述演绎计算采用传递规则、反演规则和加减规则进行演绎计算,所述传递规则、反演规则和加减规则具体为:

1)传递规则,A(b,c),c(d,e),则A(b,c)的同时也存在A(d,e),其中,A为输入词语,b和c为A的之间关联词语,且d和e为c的之间关联词语;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州学而优信息技术有限公司,未经广州学而优信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011093597.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top