这里以oracle为列说明,MYSQL或其它数据库也可以自己尝试,一但理解了 其中思路,自然就能得心应手的优化好数据库
提到删除表的字段,我们最初想到的就是
1 |
alter table xx drop column field1; |
但是当我们要对生产环境中大数据量的表进行删除字段,而且不是删除一个两个,有可能删除多个字段,此方法是否可取。网上有文章说到可以先对要删除的字段进行unused的处理,然后在系统不忙的时候执行drop column,我个人认为此方法不是不可行,只不过我认为不是最快的。
我以我自己亲身处理的一个例子,介绍下我的方法,仅供参考。
文章开始前,先讲一下背景。
客户生产环境中数据量增量很大,每个月都要有五六十G的增量。尤其是几个大表,数据量每月都是千万级增量。由于历史原因,有的表中的字段多达200多个,但实际用到的字段也就只有七八十个,也就是有一百二三个字段要干掉,进行优化。
千万级的数据表,要干掉一百二三十个字段,而且还要尽可能的不影响业务的运行。那就要求在业务最不繁忙的时候,以最快的速度处理完,怎么办。
下面介绍下我的方法。
举个例子,然后上脚本吧。
假如有个表A,A中的数据量是5000w以上,A中有200个字段,你要删掉其中的120个字段。
脚本如下:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 |
------------------脚本开始----------------- -- 创建临时表 create table A_temp tablespace ATEMP nologging as select field1,field2,,,,field80 -- 此处需要整理出A中要保留的字段 from A; / -- 删除原表 drop table A; -- 重命名表 ALTER TABLE A_temp RENAME TO A; -- 使用nologging以及parallel快速重新添加索引 create index IND_Afile on A(field2) tablespace ATEMP nologging parallel 6; alter table A add constraint PK_field primary key (field1) using index tablespace ATEMP nologging; ------------------脚本结束----------------- |
我自己试验的结果是5000w的数据表,三分钟内可以搞完。