[发明专利]一种基于结构化数据的关联词语检索方法在审
申请号: | 202011093597.0 | 申请日: | 2020-10-14 |
公开(公告)号: | CN112163003A | 公开(公告)日: | 2021-01-01 |
发明(设计)人: | 黄晓明;韦天贵;朱伟东 | 申请(专利权)人: | 广州学而优信息技术有限公司 |
主分类号: | G06F16/2455 | 分类号: | G06F16/2455;G06F16/242;G06F16/2458;G06F16/248 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 510000 广东省广州市高新技术产业开发区揽月路*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 结构 数据 关联 词语 检索 方法 | ||
1.一种基于结构化数据的关联词语检索方法,其特征在于:包括如下步骤:
S1、设定关联等级阈值,所述关联等级阈值设定根据关联词语的出现的密度进行设定,且阈值范围为≥5%,即,100个词语当中至少出现5次关联词语;
S2、输入检索词语,将需要检索的一组词语输入或者词语集合输入,词语集合之间需输入分隔符;
S3、定义词语关联空间,所述词语的关联空间包括同义词、近义词、反义词、相近词、拓展词、同音词、模糊音词语、相关图片、相关视频以及含有该词语的相关公开文献;
S4、划分关联等级,分别基于每一个目标关联词语出现的密度,计算每一个目标关联词语与所述检索词语之间的关联度,并根据其关联度划分出关联等级,所述关联等级包括A、B、C、D、E五个等级,且中A级为最高等级,所述关联的划分根据关联词语出现的密度进行划分,关联词语出现的密度越高,其关联等级越高;
S5、关联词语分组,将关联度达到设定阈值的目标词语、图片、视频以及文献,作为检索关联词语进行分组,所述分组依据其关联密度从高到低进行分组,且每组不超过十条关联度达到设定阈值的目标词语、图片、视频以及文献;
S6、关联词语呈现,将分好组的目标词语、图片、视频以及文献与组为单位呈现给用户。
2.根据权利要求1所述的一种基于结构化数据的关联词语检索方法,其特征在于:步骤S3所述的关联空间采用对比计算以及演绎计算的方式对输入词语的程度关系词语进行归纳,所述程度关系词语包括:主副关系词语、成员关系词语、类似关系词语、对立关系词语、并列关系词语。
3.根据权利要求2所述的一种基于结构化数据的关联词语检索方法,其特征在于:所述演绎计算采用传递规则、反演规则和加减规则进行演绎计算,所述传递规则、反演规则和加减规则具体为:
1)传递规则,A(b,c),c(d,e),则A(b,c)的同时也存在A(d,e),其中,A为输入词语,b和c为A的之间关联词语,且d和e为c的之间关联词语;
2)反演规则,R(b,c),R(c,d),则A(b,c)并且存在A(c,d),其中,A为输入词语,R为A的反义词,b,c组以及c,d组均为R的反义词,则反演出b,c组以及c,d组均为A的近义词;
3)加减规则,A(b,c),A(d,e),则有A(b,c)+A(d,e)=A(a,b,c,d),其中,b,c,d,e均为输入词A的关联词语。
4.根据权利要求1所述的一种基于结构化数据的关联词语检索方法,其特征在于:步骤S4所述的同义词、近义词、反义词、相近词、拓展词、同音词、模糊音词语、相关图片、相关视频以及含有该词语的相关公开文献采用系数估算法对其进行系数值估算,并且所述关联等级完全依据系数值进行划分,其中系数值的计算方法为:
其中,D为关联词语的系数值,C为系数基数平局值,为该组关联词语优先等级的平均值,k为关联词语出现的密度百分比;
其中,所述输入词本体优先等级为最高级5级,所述同义词、近义词、相近词优先等级为4级,所述拓展词、同音词、模糊音词语、含有该词语的相关公开文献优先级为3级,所述反义词、相关图片、相关视频优先级为2级;
其中,所述系数基数具体设置为:输入词系数基数100;输入词的同义词、近义词、相近词系数基数80;输入词的拓展词、同音词、模糊音词语、含有该词语的相关公开文献系数基数50;输入词的反义词、相关图片、相关视频系数基数30。
5.根据权利要求4所述的一种基于结构化数据的关联词语检索方法,其特征在于:步骤S4所述的关联等级具体为A≥100系数值,B≥85系数值,C≥60系数值,D≥40系数值,E≥25系数值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州学而优信息技术有限公司,未经广州学而优信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011093597.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种临床科研数据采集管理系统
- 下一篇:一种柳编篮加工用柳枝弯柳设备
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置