[发明专利]将文件拆分后并行加载数据入库的方法无效
申请号: | 201310009996.8 | 申请日: | 2013-01-10 |
公开(公告)号: | CN103077241A | 公开(公告)日: | 2013-05-01 |
发明(设计)人: | 王党团;徐胜平 | 申请(专利权)人: | 中国银行股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京金信立方知识产权代理有限公司 11225 | 代理人: | 黄威;胡上海 |
地址: | 100818 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文件 拆分 并行 加载 数据 入库 方法 | ||
1.一种将文件拆分后并行加载数据入库的方法,使用Oracle提供的数据装载工具SQL Loader将大数据量的文件中的数据加载入库,其特征在于,包括以下步骤:
S1:读取控制文件和数据文件,生成日志文件、坏文件和废弃文件;
S2:配置数据装载工具SQL Loader的参数;
S3:根据配置参数,判断需要加载的文件的记录数是否大于参数配置的记录限额值,如果是,则执行步骤S4;如果否,则执行步骤S6;
S4:根据参数配置的子文件记录数值将需要加载的文件顺序拆分为n个子文件;
S5:启动数据装载工具SQL Loader的m个子进程对子文件进行并行加载,每个子进程对多个子文件进行串行加载;
S6:对文件进行普通加载。
2.根据权利要求1所述的将文件拆分后并行加载数据入库的方法,其特征在于,步骤S4具体为:判断所述参数配置的子文件记录数值是否大于300000,如果是,则将文件顺序拆分为n个子文件,其中第一个到第n-1个子文件中的记录数为所述参数配置的子文件记录数值;如果否,则将文件顺序拆分为n个子文件,其中第一个到第n-1个子文件中的记录数为300000。
3.根据权利要求1所述的将文件拆分后并行加载数据入库的方法,其特征在于,步骤S3中,所述参数配置的记录限额值为500万。
4.根据权利要求1所述的将文件拆分后并行加载数据入库的方法,其特征在于,步骤S4中的拆分是用操作系统命令实现的。
5.根据权利要求2所述的将文件拆分后并行加载数据入库的方法,其特征在于,步骤S4中的所述n值为999。
6.根据权利要求5所述的将文件拆分后并行加载数据入库的方法,其特征在于,步骤S5中的所述m值不大于10。
7.根据权利要求6所述的将文件拆分后并行加载数据入库的方法,其特征在于,步骤S5中的所述m值为10,每个子进程最多对100个子文件进行串行加载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国银行股份有限公司,未经中国银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310009996.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种实现数据库服务器双机热备的方法
- 下一篇:船分段边缘用脚手架