[发明专利]一种数据查询的方法、装置、存储介质及电子设备有效
申请号: | 202310557261.2 | 申请日: | 2023-05-17 |
公开(公告)号: | CN116303625B | 公开(公告)日: | 2023-07-21 |
发明(设计)人: | 李坤;王永恒;段曼妮;巫英才;金雄男;邵研;王佳玮 | 申请(专利权)人: | 之江实验室;浙江大学 |
主分类号: | G06F16/2455 | 分类号: | G06F16/2455;G06F16/22;G06F16/901 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 邓超 |
地址: | 311121 浙江省杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据 查询 方法 装置 存储 介质 电子设备 | ||
1.一种数据查询的方法,其特征在于,包括:
获取原始数据表;
根据预设的知识图谱,确定出所述原始数据表中包含的实体信息,并在所述原始数据表中对确定出的所述实体信息进行标注,得到标注后数据表;
将所述标注后数据表和所述知识图谱输入到预设的分类模型中,以使所述分类模型根据所述知识图谱确定出所述原始数据表中各列数据对应的实体类型,以及根据所述知识图谱中各实体信息之间的实体关系,确定出所述原始数据表中各列数据对应的实体类型之间的关系,作为实体类型关系;
根据所述实体类型关系以及所述标注后数据表中包含的实体信息,确定补充信息,所述补充信息包含第一描述信息和第二描述信息中的至少一种,针对所述原始数据表中包含的每个实体信息,该实体信息对应的第一描述信息用于描述该实体信息,所述第二描述信息用于描述所述原始数据表中各列数据对应实体类型之间的关系;
通过补充信息,补充所述原始数据表,得到补充后数据表;
接收数据查询请求,并从所述数据查询请求中确定出用于描述用户需要查询的数据的查询参考信息,以及根据所述查询参考信息和所述补充后数据表中包含的所述第一描述信息和/或所述第二描述信息,执行数据查询。
2.如权利要求1所述的方法,其特征在于,所述补充信息还包括:第三描述信息,针对所述原始数据表中的每列数据,该列数据对应的第三描述信息用于描述该列数据的主题;
所述方法还包括:
根据确定出的所述原始数据表中各列数据对应的实体类型,确定所述第三描述信息。
3.如权利要求1所述的方法,其特征在于,在根据预设的知识图谱,确定出所述原始数据表中包含的实体信息之前,所述方法还包括:
识别出所述原始数据表中缺失的数据和/或脏数据;
根据所述缺失的数据和/或所述脏数据,对所述原始数据表进行预处理,得到处理后数据表;
根据预设的知识图谱,确定出所述原始数据表中包含的实体信息,具体包括:
根据预设的知识图谱,确定出所述处理后数据表中包含的实体信息。
4.如权利要求1所述的方法,其特征在于,将所述标注后数据表和所述知识图谱输入到预设的分类模型中,以使所述分类模型根据所述知识图谱确定出所述原始数据表中各列数据对应的实体类型,以及根据所述知识图谱中各实体信息之间的实体关系,确定出所述原始数据表中各列数据对应的实体类型之间的关系,作为实体类型关系,具体包括:
将所述标注后数据表和所述知识图谱输入到预设的分类模型中,以使所述分类模型得到所述标注后数据表中每个数据的特征表示、所述知识图谱中包含的实体信息对应的实体类型的特征表示,以及所述知识图谱中各实体信息之间的实体关系的特征表示;
根据所述每个数据的特征表示和所述知识图谱中包含的实体信息对应的实体类型的特征表示之间的相似度,确定所述原始数据表中各列数据对应的实体类型;
确定所述原始数据表中各列数据对应的实体类型的特征表示,并根据所述原始数据表中各列数据对应的实体类型的特征表示和所述知识图谱中各实体信息之间的实体关系的特征表示之间的相似度,确定出所述原始数据表中各列数据对应的实体类型之间的关系,作为实体类型关系。
5.如权利要求1所述的方法,其特征在于,根据所述查询参考信息和所述补充后数据表中包含的所述第一描述信息和/或所述第二描述信息,执行数据查询,具体包括:
确定出与所述查询参考信息相匹配的第一描述信息和/或第二描述信息;
根据与所述查询参考信息相匹配的第一描述信息和/或与所述查询参考信息相匹配的第二描述信息,确定所述补充后数据表中待查询数据所在的行;
根据所述待查询数据所在的行中每个数据对应实体类型之间的关系,返回查询结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于之江实验室;浙江大学,未经之江实验室;浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310557261.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于搜索的深度学习模型部署方法及装置
- 下一篇:一种微生物快速取样装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置