在大型的企业应用或企业级的数据库应用中要处理的数据量通常可以达到几十到几百GB有的甚至可以到TB级虽然存储介质和数据处理技术的发展也很快但是仍然不能满足用户的需求为了使用户的大量的数据在读写操作和查询中速度更快Oracle提供了对表和索引进行分区的技术以改善大型应用系统的性能
使用分区的优点
·增强可用性如果表的某个分区出现故障表在其他分区的数据仍然可用
·维护方便如果表的某个分区出现故障需要修复数据只修复该分区即可
·均衡I/O可以把不同的分区映射到磁盘以平衡I/O改善整个系统性能
·改善查询性能对分区对象的查询可以仅搜索自己关心的分区提高检索速度
Oracle数据库提供对表或索引的分区方法有三种
·范围分区
·Hash分区(散列分区)
·复合分区
下面将以实例的方式分别对这三种分区方法来说明分区表的使用为了测试方便我们先建三个表空间
以下为引用的内容
create tablespace dinya_space
datafile /test/demo/oracle/demodata/dinyadnf size M
create tablespace dinya_space
datafile /test/demo/oracle/demodata/dinyadnf size M
create tablespace dinya_space
datafile /test/demo/oracle/demodata/dinyadnf size M
分区表的创建
范围分区
范围分区就是对数据表中的某个值的范围进行分区根据某个值的范围决定将该数据存储在哪个分区上如根据序号分区根据业务记录的创建日期进行分区等
需求描述有一个物料交易表表名material_transactions该表将来可能有千万级的数据记录数要求在建该表的时候使用分区表这时候我们可以使用序号分区三个区每个区中预计存储三千万的数据也可以使用日期分区如每五年的数据存储在一个分区上
根据交易记录的序号分区建表 以下为引用的内容
SQL> create table dinya_test
(
transaction_id number primary key
item_id number() not null
item_description varchar()
transaction_date date not null
)
partition by range (transaction_id)
(
partition part_ values less than() tablespace dinya_space
partition part_ values less than() tablespace dinya_space
partition part_ values less than(maxvalue) tablespace dinya_space
);
Table created
建表成功根据交易的序号交易ID在三千万以下的记录将存储在第一个表空间dinya_space中分区名为:par_在三千万到六千万之间的记录存储在第二个表空间
dinya_space中分区名为par_而交易ID在六千万以上的记录存储在第三个表空间dinya_space中分区名为par_
根据交易日期分区建表
以下为引用的内容
SQL> create table dinya_test
(
transaction_id number primary key
item_id number() not null
item_description varchar()
transaction_date date not null
)
partition by range (transaction_date)
(
partition part_ values less than(to_date(yyyymmdd))
tablespace dinya_space
partition part_ values less than(to_date(yyyymmdd))
tablespace dinya_space
partition part_ values less than(maxvalue) tablespace dinya_space
);
Table created
这样我们就分别建了以交易序号和交易日期来分区的分区表每次插入数据的时候系统将根据指定的字段的值来自动将记录存储到制定的分区(表空间)中
当然我们还可以根据需求使用两个字段的范围分布来分区如partition
by range ( transaction_id transaction_date)
分区条件中的值也做相应的改变请读者自行测试
Hash分区(散列分区)
散列分区为通过指定分区编号来均匀分布数据的一种分区类型因为通过在I/O设备上进行散列分区使得这些分区大小一致如将物料交易表的数据根据交易ID散列地存放在指定的三个表空间中
以下为引用的内容
SQL> create table dinya_test
(
transaction_id number primary key
item_id number() not null
item_description varchar()
transaction_date date
)
partition by hash(transaction_id)
(
partition part_ tablespace dinya_space
partition part_ tablespace dinya_space
partition part_ tablespace dinya_space
);
Table created
建表成功此时插入数据系统将按transaction_id将记录散列地插入三个分区中这里也就是三个不同的表空间中
复合分区
有时候我们需要根据范围分区后每个分区内的数据再散列地分布在几个表空间中这样我们就要使用复合分区复合分区是先使用范围分区然后在每个分区内再使用散列分区的一种分区方法如将物料交易的记录按时间分区然后每个分区中的数据分三个子分区将数据散列地存储在三个指定的表空间中
以下为引用的内容
SQL> create table dinya_test
(
transaction_id number primary key
item_id number() not null
item_description varchar()
transaction_date date
)
partition by range(transaction_date)subpartition by hash(transaction_id)
subpartitions store in (dinya_spacedinya_spacedinya_space)
(
partition part_ values less than(to_date(yyyymmdd))
partition part_ values less than(to_date(yyyymmdd))
partition part_ values less than(maxvalue)
);
Table created
该例中先是根据交易日期进行范围分区然后根据交易的ID将记录散列地存储在三个表空间中
分区表操作
以上了解了三种分区表的建表方法下面将使用实际的数据并针对按日期的范围分区来测试分区表的数据记录的操作
插入记录
以下为引用的内容
SQL> insert into dinya_test values(BOOKSsysdate);
row created
SQL> insert into dinya_test values( BOOKSsysdate+);
row created
SQL> insert into dinya_test values( BOOKSto_date(yyyymmdd));
row created
SQL> insert into dinya_test values( BOOKSto_date(yyyymmdd));
row created
SQL> insert into dinya_test values( BOOKSto_date(yyyymmdd));
row created
SQL> insert into dinya_test values( BOOKSto_date(yyyymmdd));
row created
SQL> commit;
Commit complete
SQL>
按上面的建表结果年前的数据将存储在第一个分区part_上而年到年的交易数据将存储在第二个分区part_上年以后的记录存储在第三个分区part_上
查询分区表记录 以下为引用的内容
SQL> select * from dinya_test partition(part_);
TRANSACTION_ID ITEM_ID ITEM_DESCRIPTION TRANSACTION_DATE
BOOKS ::
BOOKS ::
SQL>
SQL> select * from dinya_test partition(part_);
TRANSACTION_ID ITEM_ID ITEM_DESCRIPTION TRANSACTION_DATE
BOOKS
BOOKS
SQL>
SQL> select * from dinya_test partition(part_);
TRANSACTION_ID ITEM_ID ITEM_DESCRIPTION TRANSACTION_DATE
BOOKS
BOOKS
SQL>
从查询的结果可以看出插入的数据已经根据交易时间范围存储在不同的分区中这里是指定了分区的查询当然也可以不指定分区直接执行select * from dinya_test查询全部记录
在也检索的数据量很大的时候指定分区会大大提高检索速度
更新分区表的记录
以下为引用的内容
SQL> update dinya_test partition(part_) t set em_description=DESK where
ttransaction_id=;
row updated
SQL> commit;
Commit complete
SQL>
这里将第一个分区中的交易ID=的记录中的item_description字段更新为DESK可以看到已经成功更新了一条记录但是当更新的时候指定了分区而根据查询的记录不在该分区中时将不会更新数据请看下面的例子 以下为引用的内容
SQL> update dinya_test partition(part_) t set em_description=DESK where
ttransaction_id=;
rows updated
SQL> commit;
Commit complete
SQL>
指定了在第一个分区中更新记录但是条件中限制交易ID为而查询全表交易ID为的记录在第三个分区中这样该条语句将不会更新记录
删除分区表记录
以下为引用的内容
SQL> delete from dinya_test partition(part_) t where ttransaction_id=;
row deleted
SQL> commit;
Commit complete
SQL>
上面例子删除了第二个分区part_中的交易记录ID为的一条记录和更新数据相同如果指定了分区而条件中的数据又不在该分区中时将不会删除任何数据
分区表索引的使用
分区表和一般表一样可以建立索引分区表可以创建局部索引和全局索引当分区中出现许多事务并且要保证所有分区中的数据记录的唯一性时采用全局索引
局部索引分区的建立
以下为引用的内容
SQL> create index dinya_idx_t on dinya_test(item_id)
local
(
partition idx_ tablespace dinya_space
partition idx_ tablespace dinya_space
partition idx_ tablespace dinya_space
);
Index created
SQL>
看查询的执行计划从下面的执行计划可以看出系统已经使用了索引
以下为引用的内容
SQL> select * from dinya_test partition(part_) t where em_id=;
Execution Plan
SELECT STATEMENT Optimizer=CHOOSE (Cost= Card= Bytes=)
TABLE ACCESS (BY LOCAL INDEX ROWID) OF DINYA_TEST (Cost=
Card= Bytes=)
INDEX (RANGE SCAN) OF DINYA_IDX_T (NONUNIQUE) (Cost=
Card=)
Statistics
recursive calls
db block gets
consistent gets
physical reads
redo size
bytes sent via SQL*Net to client
bytes received via SQL*Net from client
SQL*Net roundtrips to/from client
sorts (memory)
sorts (disk)
rows processed
SQL>
全局索引分区的建立
全局索引建立时global 子句允许指定索引的范围值这个范围值为索引字段的范围值
以下为引用的内容
SQL> create index dinya_idx_t on dinya_test(item_id)
global partition by range(item_id)
(
partition idx_ values less than () tablespace dinya_space
partition idx_ values less than () tablespace dinya_space
partition idx_ values less than (maxvalue) tablespace dinya_space
);
Index created
SQL>
本例中对表的item_id字段建立索引分区当然也可以不指定索引分区名直接对整个表建立索引如
以下为引用的内容
SQL> create index dinya_idx_t on dinya_test(item_id);
Index created
SQL>
同样的对全局索引根据执行计划可以看出索引已经可以使用
以下为引用的内容
SQL> select * from dinya_test t where em_id=;
Execution Plan
SELECT STATEMENT Optimizer=CHOOSE (Cost= Card= Bytes=)
TABLE ACCESS (BY GLOBAL INDEX ROWID) OF DINYA_TEST (Cost
= Card= Bytes=)
INDEX (RANGE SCAN) OF DINYA_IDX_T (NONUNIQUE) (Cost=
Card=)
Statistics
recursive calls
db block gets
consistent gets
physical reads
redo size
bytes sent via SQL*Net to client
bytes received via SQL*Net from client
SQL*Net roundtrips to/from client
sorts (memory)
sorts (disk)
rows processed
SQL>
分区表的维护
了解了分区表的建立索引的建立表和索引的使用后在应用的还要经常对分区进行维护和管理日常维护和管理的内容包括增加一个分区合并一个分区及删除分区等等下面以范围分区为例说明增加合并删除分区的一般操作
增加一个分区:
以下为引用的内容
SQL> alter table dinya_test
add partition part_ values less than(to_date(yyyymmdd))
tablespace dinya_spa
ce;
Table altered
SQL>
增加一个分区的时候增加的分区的条件必须大于现有分区的最大值否则系统将提示ORA partition bound must collate higher than that of the last partition 错误
合并一个分区
以下为引用的内容
SQL> alter table dinya_test merge partitions part_part_ into partition part_;
Table altered
SQL>
在本例中将原有的表的part_分区和part_分区进行了合并合并后的分区为part_如果在合并的时候把合并后的分区定为part_的时候系统将提示ORA cannot reuse lowerbound partition as resulting partition 错误
删除分区
以下为引用的内容
SQL> alter table dinya_test drop partition part_;
Table altered
SQL>
删除分区表的一个分区后查询该表的数据时显示该分区中的数据已全部丢失所以执行删除分区动作时要慎重确保先备份数据后再执行或将分区合并
总结
需要说明的是本文在举例说名分区表事务操作的时候都指定了分区因为指定了分区系统在执行的时候则只操作该分区的记录提高了数据处理的速度不要指定分区直接操作数据也是可以的在分区表上建索引及多索引的使用和非分区表一样此外因为在维护分区的时候可能对分区的索引会产生一定的影响可能需要在维护之后重建索引相关内容请参考分区表索引部分的文档本文出自 CTOCOM技术博客