[发明专利]一种基于6W语义标识的元数据仓库启发式智能搜索方法有效

专利信息
申请号: 201510397909.X 申请日: 2015-07-08
公开(公告)号: CN104978426B 公开(公告)日: 2018-03-02
发明(设计)人: 谭远华;张超林;夏冬梅 申请(专利权)人: 克拉玛依红有软件有限责任公司
主分类号: G06F17/30 分类号: G06F17/30;G06F17/27
代理公司: 北京市盛峰律师事务所11337 代理人: 于国富
地址: 834000 新疆维*** 国省代码: 新疆;65
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 语义 标识 数据仓库 启发式 智能 搜索 方法
【说明书】:

技术领域

发明涉及信息技术领域,尤其涉及一种基于6W语义标识的元数据仓库启发式智能搜索方法。

背景技术

飞速发展的Internet给用户提供了海量的信息资源,导致用户从爆炸性增长的信息中迅速获得需要的信息变得越来越困难。用户在搜索问题过程中,由于现有搜索方法对问题的理解层次不够深入,导致对用户的提出的问题往往答非所问、对问题的识别和分析不够深入,无法找到符合用户预期的信息。

发明内容

本发明的目的在于提供一种基于6W语义标识的元数据仓库启发式智能搜索方法,从而解决现有技术中存在的前述问题。

为了实现上述目的,本发明所述基于6W语义标识的元数据仓库启发式智能搜索方法,该方法包括以下步骤:

S1,分解关键词:

从用户输入的自然语言中获取关键词,并对所述关键词进行语义解析,然后标识出每个关键词对应的数据元,得到每个关键词的数据元标识,将排序后的所有被标识数据元作为索引;

S2,将所有被标识数据元进行场景匹配处理:

根据S1中被标识数据元的标识,匹配业务模型中与所述标识相关联的场景;

S3,补充缺失项处理:

判断被标识数据元的标识所对应的场景数是否大于预先设定的阈值,如果是,进行补充缺失项处理,得到补充缺失项后总数据元标识所对应的场景,然后进入S4;如果否,则直接进入S4;

S4,数据捞取处理:

判断任意一个场景A所对应的数据元标识E在元数据仓库中是否找到对应的数据,如果是,则从元数据仓库中获取数据元标识E所对应的数据,将所述数据进行知识计算后得到结果构建数据集,然后进入S6;如果否,则进入S5;

S5,将用户输入的自然语言记录下来,并提醒用户没有所述自然语言的搜索结果;

S6,将数据集中按照系列层、集合层、实体层、子集层顺序进行逻辑排列的结果进行展示。

优选地,步骤S1所述分解关键词,具体按照下述步骤实现:

S11,根据元数据模型、数据元素模型和元数据仓库形成的词典对用户输入的自然语言进行分词,得到自然语言中的已知关键词;

S12,获取已知关键词对应的数据元,并对所述数据元对应的数据元标识;

S13,判断被标识的数据元中是否存在数值数据,如果存在,则抽取所述数值数据;

S14,按照现有的数据元有既定的分类排序规则,将步骤S12中被标识数据元进行排列,将排序后的所有被标识数据元作为索引。

更优选地,步骤S11中,所述根据元数据模型、数据元素模型和元数据仓库形成的词典,具体按照下述步骤实现:

S111,读取元数据仓库中的元数据,得到元数据的标识、元数据的数据和元数据的描述,把元数据的数据作为索引对象;

S112,读取元数据模型中,得到元数据模型信息,根据元数据模型的结构将元数据模型信息作为索引对象;

S113,读取数据元素模型,得到数据元素模型信息,根据数据元素模型的结构将数据元素模型信息作为索引对象;

S114,上述S111的索引对象元数据的数据、S112的索引对象元数据模型信息、S113的索引对象数据元素模型信息作为词典的索引,完成词典的构建,词典按照预设的更新时间而变化,所述词典被存入内存。

优选地,一个关键词至少对应一个数据元,一个数据元仅有一个数据元标识。

优选地,步骤S2将被标识数据元进行场景匹配处理,具体按照下述步骤实现:

S21,判断每个关键词的数据元标识所属的标识层,所述标识层范围从大到小依次为系列层、集合层、实体层、子集层;

S22,根据系列层、集合层、实体层、子集层的顺序排序数据元标识,排序在前的数据元标识优先匹配语义解析后的关键词,得到基础场景集;

S23,计算基础场景集中数据元标识与语义解析后的关键词的匹配度,得到匹配度高于预先设定阈值的第一场景集;

S24,根据系列、集合、实体、子集的顺序进行第一场景集二次排序,得到第二场景集。

优选地,步骤S3补充缺失项处理,具体按照下述步骤实现:

S31,解析数据元标识对应的场景集,判断场景中的活动是否缺失,得到并标记活动缺失的场景;

S32,将活动缺失的场景的标记组成树结构,返回展示界面供用户选择;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于克拉玛依红有软件有限责任公司,未经克拉玛依红有软件有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201510397909.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top