[发明专利]一种基于本体的数据检索方法在审
申请号: | 202111463663.3 | 申请日: | 2021-12-03 |
公开(公告)号: | CN114254162A | 公开(公告)日: | 2022-03-29 |
发明(设计)人: | 唐志一;张豹;陈伟荣;黄颖;王会;郭政杰;蔡颖;王清华 | 申请(专利权)人: | 中国电子科技集团公司第二十八研究所 |
主分类号: | G06F16/901 | 分类号: | G06F16/901;G06F16/906;G06F16/909;G06F40/242;G06F40/247;G06F40/289 |
代理公司: | 江苏圣典律师事务所 32237 | 代理人: | 黄振华 |
地址: | 210000 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 本体 数据 检索 方法 | ||
1.一种基于本体的数据检索方法,其特征在于,包括如下步骤:
步骤1,根据本体框架,分析数据结构与数据特征;
步骤2,根据数据结构与数据特征,建立树状结构聚合模板;
步骤3,利用大数据分析方法,分析搜索习惯与需求,抽象检索条件;
步骤4,根据得到的检索条件,使用构建模式设计检索参数;
步骤5,根据聚合模板内容从数据库中、文本文件中或利用录入的方式加入数据,然后抽取相对应的数据;
步骤6,根据检索参数,将数据与参数结合,完成数据的预处理;
步骤7,将预处理好的数据存入图数据库;
步骤8,根据自然语言解析算法解析输入的检索语句;
步骤9,利用解析的检索词在图数据库中检索。
2.根据权利要求1所述的方法,其特征在于,步骤1包括:
根据本体框架,对数据结构与数据特征进行分析,得到符合本体框架描述的要素,并记录所述要素。
3.根据权利要求2所述的方法,其特征在于,步骤1中,所述本体框架是指一组定义和概念之间的层级关系,根据本体与概念的属性来定义本体框架结构及其属性,每类本体按照实际需要分为两个层级以上的子类,进行扩展;定义好层级后,根据层级对概念的描述来逐层细化概念的自身属性及其限制,从而形成聚合模板。
4.根据权利要求3所述的方法,其特征在于,步骤2包括:
将数据库中数据表之间的关系与数据表的特征根据步骤1得到的要素聚合在树状结构中,从而抽象而成聚合模板。
5.根据权利要求4所述的方法,其特征在于,步骤3包括:
利用大数据分析方法,分析搜索习惯与需求,得到搜索条件,并将搜索条件进行抽象化描述。
6.根据权利要求5所述的方法,其特征在于,步骤4包括:
利用构建模式概括搜索条件的抽象化描述信息,形成常用搜索条件的树形结构。
7.根据权利要求6所述的方法,其特征在于,步骤5包括:
根据聚合模板对数据进行分类、抽取,抽取数据的方法包括从数据库中读取相关数据、从文件中提取相关数据或录入相关数据。
8.根据权利要求7所述的方法,其特征在于,步骤6包括:
根据步骤4中建立得到的检索参数,将步骤5中抽取的数据与检索参数结合,完成数据的预处理。
9.根据权利要求8所述的方法,其特征在于,步骤7包括:
将预处理好的数据存入图数据库,存入数据时同时将预处理好的数据所对应的聚合模板与所包含的检索参数同时存储进图数据库。
10.根据权利要求9所述的方法,其特征在于,步骤8包括:
利用自然语言解析算法对检索语句进行分词处理,使用的自然语言解析算法包括基于词典的分词方法与基于统计的分词方法,同时添加同义词并去除停用词;
所述基于词典的分词方法是指建立词典表,当检索词中存在词典表中的字段时优先按照词典表中的内容进行分词处理;
所述基于统计的分词方法是指对常用的字段进行统计,当检索词中出现常用的字段时优先按照统计量高的字段进行分词;
所述添加同义词是指建立同义词表,进行分词处理时当出现同义词时自动将分词换为分词对应的同义词进行处理;
所述去除停用词是指建立停用词典表,进行分词处理时不考虑使用停用词字典表中的字段进行分词处理;
步骤9包括:
进行检索时,直接根据输入的搜索词利用基于词典的分词方法与基于统计的分词方法进行分词处理,将输入的检索内容分为词语字段,然后根据同义词表对词语字段进行转换或根据停用词表对词语字段进行去除处理,将处理后的词语字段在图数据库中进行检索,将检索得到的结果根据与词语的关联程度进行排序并呈现。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电子科技集团公司第二十八研究所,未经中国电子科技集团公司第二十八研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111463663.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:木材加工仿形机
- 下一篇:基于区块链网络的校园安全巡检系统
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置