[发明专利]一种基于结构化数据的关联词语检索方法在审
申请号: | 202011093597.0 | 申请日: | 2020-10-14 |
公开(公告)号: | CN112163003A | 公开(公告)日: | 2021-01-01 |
发明(设计)人: | 黄晓明;韦天贵;朱伟东 | 申请(专利权)人: | 广州学而优信息技术有限公司 |
主分类号: | G06F16/2455 | 分类号: | G06F16/2455;G06F16/242;G06F16/2458;G06F16/248 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 510000 广东省广州市高新技术产业开发区揽月路*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 结构 数据 关联 词语 检索 方法 | ||
本发明公开了一种基于结构化数据的关联词语检索方法,包括如下步骤:S1、设定关联等级阈值;S2、输入检索词语;S3、定义词语关联空间;S4、划分关联等级;S5、关联词语分组;S6、关联词语呈现。本发明提供的一种基于结构化数据的关联词语检索方法,与传统的关联词语检索方法相比,本发明在输入词与其相关的同义词、近义词、反义词、相近词、拓展词、同音词、模糊音词语、相关图片、相关视频以及含有该词语的相关公开文献进行等级划分后,再次将除输入词以外的词语进行等级划分,并根据优先等级分组展示给用户,一定程度上提高了用户搜索后结果的准确性。
技术领域
本发明属于关联词语检索领域,更具体地说,尤其涉及一种基于结构化数据的关联词语检索方法。
背景技术
结构化数据,简单来说就是数据库。结合到典型场景中更容易理解,比如企业ERP、财务系统;医疗HIS数据库;教育一卡通;政府行政审批;其他核心数据库等。这些应用需要哪些存储方案呢?基本包括高速存储应用需求、数据备份需求、数据共享需求以及数据容灾需求,随着英特网上信息数据量的剧增,搜索引擎为了更好的服务于用户,就有必要采取辅助手段来提高搜索效率,而智能推荐检索关联词语就是多种辅助手段中的一种。
目前,现有技术大多是将输入词与其相关的同义词、近义词、反义词、相近词、拓展词、同音词、模糊音词语、相关图片、相关视频以及含有该词语的相关公开文献等进行等级划分,并展示给用户,但是对于输入词的同义词、近义词、反义词、相近词、拓展词、同音词、模糊音词语、相关图片、相关视频以及含有该词语的相关公开文献等并未进行细致划分,这就一定程度上影响了用户搜索的准确性,因此,我们提出一种基于结构化数据的关联词语检索方法。
发明内容
本发明的目的是为了解决现有技术中存在的缺点,而提出的一种基于结构化数据的关联词语检索方法。
为实现上述目的,本发明提供如下技术方案:
一种基于结构化数据的关联词语检索方法,包括如下步骤:
S1、设定关联等级阈值,所述关联等级阈值设定根据关联词语的出现的密度进行设定,且阈值范围为≥5%,即,100个词语当中至少出现5次关联词语;
S2、输入检索词语,将需要检索的一组词语输入或者词语集合输入,词语集合之间需输入分隔符;
S3、定义词语关联空间,所述词语的关联空间包括同义词、近义词、反义词、相近词、拓展词、同音词、模糊音词语、相关图片、相关视频以及含有该词语的相关公开文献;
S4、划分关联等级,分别基于每一个目标关联词语出现的密度,计算每一个目标关联词语与所述检索词语之间的关联度,并根据其关联度划分出关联等级,所述关联等级包括A、B、C、D、E五个等级,且中A级为最高等级,所述关联的划分根据关联词语出现的密度进行划分,关联词语出现的密度越高,其关联等级越高;
S5、关联词语分组,将关联度达到设定阈值的目标词语、图片、视频以及文献,作为检索关联词语进行分组,所述分组依据其关联密度从高到低进行分组,且每组不超过十条关联度达到设定阈值的目标词语、图片、视频以及文献;
S6、关联词语呈现,将分好组的目标词语、图片、视频以及文献与组为单位呈现给用户。
优选的,步骤S3所述的关联空间采用对比计算以及演绎计算的方式对输入词语的程度关系词语进行归纳,所述程度关系词语包括:主副关系词语、成员关系词语、类似关系词语、对立关系词语、并列关系词语。
优选的,所述演绎计算采用传递规则、反演规则和加减规则进行演绎计算,所述传递规则、反演规则和加减规则具体为:
1)传递规则,A(b,c),c(d,e),则A(b,c)的同时也存在A(d,e),其中,A为输入词语,b和c为A的之间关联词语,且d和e为c的之间关联词语;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州学而优信息技术有限公司,未经广州学而优信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011093597.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种临床科研数据采集管理系统
- 下一篇:一种柳编篮加工用柳枝弯柳设备
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置