[发明专利]结构化数据的搜索方法、装置、设备及存储介质在审

专利信息
申请号: 202110157078.4 申请日: 2021-02-03
公开(公告)号: CN112818005A 公开(公告)日: 2021-05-18
发明(设计)人: 王少旭;徐新标 申请(专利权)人: 北京清科慧盈科技有限公司
主分类号: G06F16/242 分类号: G06F16/242;G06F16/2457;G06F16/248
代理公司: 深圳市世纪恒程知识产权代理事务所 44287 代理人: 关向兰
地址: 100000 北京市通州区恒*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 结构 数据 搜索 方法 装置 设备 存储 介质
【说明书】:

发明涉及互联网技术领域,公开了一种结构化数据的搜索方法、装置、设备及存储介质,所述方法包括:获取自然语言的结构化数据,对所述结构化数据进行分类,根据分类后的结构化数据生成对应的数据模型,根据所述数据模型进行数据集创建,以获得结构化数据集;根据所述结构化数据集生成对应的初始词库;获取预设输入查询语句,根据所述预设输入查询语句在所述初始词库中对所述结构化数据进行搜索,以获得目标结构化数据。本发明通过采集结构化数据,并对所述结构化数据进行处理,以生成对应的初始词库,获取预设输入查询语句,并根据所述预设查询语句在所述初始词库中进行搜索,从而能够有效提高搜索效率并降低获得结构化数据的成本。

技术领域

本发明涉及互联网技术领域,尤其涉及结构化数据的搜索方法、装置、设备及存储介质。

背景技术

随着数据业务的发展,同一个业务中,一般既有结构化数据,也有非结构化数据,有时候两种类型的数据还会有某种对应关系,需要关联处理。其中,结构化数据是指行数据,存储在数据库里,可以用二维表结构来逻辑表达的数据,而难以用数据库二维逻辑表来表现的数据即称为非结构化数据,对于结构化数据可直接采用关系型数据库存储,因此,在对结构化数据进行查询时由于其结构关系的存在,导致查询数据化结构难度较高,而现有技术是通过结构化数据内部关联查询,但是通过该查询方式获得的结构化数据的成本较高且搜索效率较低。

上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。

发明内容

本发明的主要目的在于提供一种结构化数据的搜索方法、装置、设备及存储介质,旨在解决无法有效提高搜索效率并降低获得结构化数据的成本的技术问题。

为实现上述目的,本发明提供了一种结构化数据的搜索方法,所述结构化数据的搜索方法包括以下步骤:

获取自然语言的结构化数据,对所述结构化数据进行分类,获得不同类型的结构化数据;

根据所述不同类型的结构化数据生成对应的数据模型,根据所述数据模型进行数据集创建,以获得结构化数据集;

根据所述结构化数据集生成对应的初始词库;

获取预设输入查询语句,根据所述预设输入查询语句在所述初始词库中对所述结构化数据进行搜索,以得到目标结构化数据。

可选地,所述获取自然语言的结构化数据,对所述结构化数据进行分类,获得不同类型的结构化数据,包括:

获取自然语音的结构化数据,对所述结构化数据中的指标信息和对象信息进行特征提取,获得对应的特征信息;

根据所述特征信息对所述结构化数据进行分类,获得不同类型的结构化数据。

可选地,所述获取预设输入查询语句,根据所述预设输入查询语句在所述初始词库中对所述结构化数据进行搜索,以得到目标结构化数据之前,还包括:

获取初始词库添加指令,根据所述初始词库添加指令提取预设同义词;

将所述预设同义词添加至所述初始词库,生成第一目标词库;

获取预设输入查询语句,根据所述预设输入查询语句在所述初始词库中对所述结构化数据进行搜索,以得到目标结构化数据,包括:

获取预设输入查询语句,根据所述预设输入查询语句在所述第一目标词库中对结构化数据进行搜索,以得到目标结构化数据。

可选地,所述获取预设输入查询语句,根据所述预设输入查询语句在所述初始词库中对所述结构化数据进行搜索,以得到目标结构化数据之前,还包括:

获取时间维度和分析术语的关键字,判断所述初始词库中是否存在所述关键字;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京清科慧盈科技有限公司,未经北京清科慧盈科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110157078.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top