[发明专利]基于HBASE的批量装载快速生成数据统计信息的方法在审
申请号: | 202010411311.2 | 申请日: | 2020-05-15 |
公开(公告)号: | CN111625577A | 公开(公告)日: | 2020-09-04 |
发明(设计)人: | 陈贇人;杨永锋 | 申请(专利权)人: | 贵州易鲸捷信息技术有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/25 |
代理公司: | 成都中炬新汇知识产权代理有限公司 51279 | 代理人: | 罗韬 |
地址: | 550000 贵州省贵阳市贵阳综*** | 国省代码: | 贵州;52 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于HBASE的批量装载快速生成数据统计信息的方法,属一种数据信息快速统计方法,步骤A、在HDFS目录下生成BulkLoad目录,用于存放将外部数据转换成HBASE格式的HFile文件;步骤B、在HDFS目录下生成BulkLoadStats统计信息目录,用于存放统计信息数据的HFile文件;该方法通过在第一次读取所有外部数据并将其转换为HBASE格式的HFile文件时,同时进行统计信息的数据收集,从而仅需一次全量外部数据的读取扫描即可完成原表与统计信息采样表数据的生成,比同类方法对于全量数据读取的性能提升了一倍,尤其适于对较大数据量的外部数据进行数据统计信息表生成。 | ||
搜索关键词: | 基于 hbase 批量 装载 快速 生成 数据 统计 信息 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于贵州易鲸捷信息技术有限公司,未经贵州易鲸捷信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202010411311.2/,转载请声明来源钻瓜专利网。