[发明专利]数据模型的生成方法和装置在审
申请号: | 202110430181.1 | 申请日: | 2021-04-21 |
公开(公告)号: | CN113760864A | 公开(公告)日: | 2021-12-07 |
发明(设计)人: | 蒲海洋 | 申请(专利权)人: | 北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06F16/21 | 分类号: | G06F16/21;G06F16/242;G06F16/28 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 张娜;刘芳 |
地址: | 100176 北京市经济技术开*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据模型 生成 方法 装置 | ||
1.一种数据模型的生成方法,其特征在于,包括:
从用户输入的第一结构化查询语言SQL语句中提取目标指标和目标维度的特征字段;
从全量特征库中确定所述目标指标的可替换指标,其中,所述全量特征库中存储有数据仓库中的SQL语句的指标和维度的特征字段,所述指标和维度的特征字段包括类型、全局唯一字段名称以及以下字段中的一个或者多个字段:字段名称、字段所在表、来源表路径、来源字段路径、过滤条件、计算逻辑;
根据所述可替换指标和所述目标维度重组得到第二SQL语句,输出所述第二SQL语句,所述第二SQL语句为所述第一SQL语句的可替换语句。
2.根据权利要求1所述的方法,其特征在于,所述从全量特征库中确定所述目标指标的可替换指标,包括:
针对每个所述目标指标,获取所述目标指标的全局唯一名称字段;
从所述全量特征库中查询与所述目标指标的全局唯一名称字段相同的所有指标组成第一候选指标集合;
根据所述目标指标的来源表路径,从所述第一候选指标集合中确定与所述目标指标的来源表路径相同的指标,得到第二候选指标集合;
根据所述目标指标的来源字段路径,从所述第二候选指标集合中确定与所述目标指标的来源字段路径相同的指标,得到第三候选指标集合;
根据所述目标指标的计算逻辑,从所述第三候选指标集合中确定与所述目标指标的计算逻辑相同的指标,得到第四候选指标集合;
根据所述目标指标的过滤条件,从所述第四候选指标集合中确定与所述目标指标的过滤条件相同的指标,得到所述目标指标的可替换指标。
3.根据权利要求1或2所述的方法,其特征在于,所述第一SQL语句中包括多个目标指标,所述根据所述可替换指标和所述目标维度重组得到第二SQL语句,包括:
当所述第一SQL语句中的多个目标指标的可替换指标的字段所在表均相同时,将所述第一SQL语句中的多个目标指标替换为可替换指标得到所述第二SQL语句。
4.根据权利要求1或2所述的方法,其特征在于,所述第一SQL语句中包括多个目标指标,所述根据所述可替换指标和所述目标维度重组得到第二SQL语句,包括:
当所述第一SQL语句中的多个目标指标的可替换指标的字段所在表均不相同时,分别以每个可替换指标为主字段,与所述第一SQL语句中的所有维度字段内连接得到单一指标的临时表,将每个临时表插入SQL语句中得到第三SQL语句;
将得到的所有第三SQL语句进行内连接得到所述第二SQL语句。
5.根据权利要求1或2所述的方法,其特征在于,所述第一SQL语句中包括多个目标指标,根据所述可替换指标和所述目标维度重组得到第二SQL语句,包括:
当所述第一SQL语句中的第一目标指标具有可替换指标,且第二目标指标不具有可替换指标时,分别以每个可替换指标为主字段,与所述第一SQL语句中的所有维度字段内连接得到单一指标的临时表,将每个临时表插入SQL语句中得到第三SQL语句;
将得到的所有第三SQL语句进行内连接得到第四SQL语句;
将所述第四SQL语句与所述第二目标指标构造得到第五SQL语句进行内连接,得到所述第二SQL语句。
6.根据权利要求1所述的方法,其特征在于,还包括:
获取所述数据仓库中的所有数据模型的最新运行日志;
抽取所述运行日志中的SQL语句,清洗所述SQL语句中的干扰字符;
对清洗后的所述SQL语句进行特征提取;
将所述SQL语句提取到的特征存储到所述全量特征库中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司,未经北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110430181.1/1.html,转载请声明来源钻瓜专利网。