[发明专利]支持SQL驱动的AI与特征工程的决策型分布式数据库系统有效
申请号: | 201811190144.2 | 申请日: | 2018-10-12 |
公开(公告)号: | CN109408591B | 公开(公告)日: | 2021-11-09 |
发明(设计)人: | 张德辉 | 申请(专利权)人: | 北京聚云位智信息科技有限公司 |
主分类号: | G06F16/27 | 分类号: | G06F16/27;G06F16/25 |
代理公司: | 北京卓爱普专利代理事务所(特殊普通合伙) 11920 | 代理人: | 王玉松 |
地址: | 100101 北京市朝阳区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 支持 sql 驱动 ai 特征 工程 决策 分布式 数据库 系统 | ||
1.一种支持SQL驱动的AI与特征工程的决策型分布式数据库系统,其特征在于,所述数据库系统包括:
AISQL解析器(1),用于解析AISQL并生成逻辑执行计划;
关系表及AI模型元数据库(2),用于存储元数据表信息;
执行计划优化器(3),用于将逻辑执行计划进行优化,并生成执行代价较小的物理执行计划;
特征工程知识库(4),用于存储系统内置的领域数据类型、与领域数据类型相匹配的特征处理算法的关联关系以及存储每个领域数据类型特征数据;
AI算法库(5),用于集成多种AI算法以及分布式计算引擎,其中数据在不同编程语言或AI库间高效的转换传输采用公共数据层,所述公共数据层包括Apache Arrow;
支持AI计算的分布式执行器(6),用于将物理执行计划分解成多个步骤进行运行;
支持AI模型存储的分布式存储器(7),用于管理和存储关系表或AI模型的数据信息;
所述AISQL解析器(1)包括AISQL解析模块(11),所述AISQL解析模块(11)包括:
词法分析单元(110),用于将输入的AISQL语句解析成令牌流;
语法分析单元(111),用于将令牌流解析为语法树;
关系表解析单元(112),用于将语法树中的关系表解析为具有元数据信息的关系表信息对象;
AI模型解析单元(113),用于将语法树中AI模型解析为具有元数据信息的AI模型信息对象;
算法解析单元(114),用于将语法树中函数的名称解析为具有完整类型信息的函数描述对象,所述函数包括AI计算函数;
解析完成单元(115),用于根据上述解析得到解析好的语法树。
2.根据权利要求1所述的支持SQL驱动的AI与特征工程的决策型分布式数据库系统,其特征在于,所述AISQL解析器(1)还包括逻辑计划生成模块(12),所述逻辑计划生成模块(12)包括:
连接运算步骤生成单元(120),用于根据SQL的JOIN操作生成关系代数的连接运算步骤;
集合运算步骤生成单元(121),根据SQL的并/交/差/除集合操作生成相应的关系代数并/交/差/除运算步骤;
特征工程计算步骤生成单元(122),用于根据特征工程处理算法生成对应的特征工程计算步骤,其中,若是采用智能特征工程计算,则构造一通过特征知识库进行匹配的系列计算步骤;
AI计算步骤生成单元(123),用于根据AI计算函数生成对应的AI计算步骤,包括参数的自动转换以及根据AI算法库(5)构造逻辑执行计划的AI计算对象,其中AI算法函数为AISQL解析模块(11)解析后得到的具有完整类型信息的函数描述对象;
选择运算生成单元(124),用于根据SQL的条件过滤信息生成关系代数选择运算;
投影运算生成单元(125),用于根据SQL的selectlist信息生成关系代数投影运算,包括表达式计算的生成;
逻辑执行计划单元(126),用于根据上述运算得到一个根据语法树信息创建的逻辑执行计划,所述逻辑执行计划为一系列关系代数运算或AI运算。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京聚云位智信息科技有限公司,未经北京聚云位智信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811190144.2/1.html,转载请声明来源钻瓜专利网。