oracle分区技术

wang_rx 发表于 2018-9-13 08:47:23

　　用户可以采用列表分区（list partitioning）显示地控制如何将数据行映射到各个分区。用户在各分区的定义中指定一个分区键（partitioning key）离散值的列表，从而实现列表分区。列表分区与范围分区（range partitioning）有所不同，在范围分区中是为每个分区设定一个分区键值的范围；列表分区与哈希分区也有区别，哈希分区是通过一个哈希函数（hash function）控制数据行与分区间的映射关系。用户可以采用列表分区，将无序（unordered）或互不相关（unrelated）的数据进行分组整理。
　　CREATE TABLE sales_list(
　　salesman_id NUMBER(5),
　　salesman_name VARCHAR2(30),
　　sales_state VARCHAR2(20),
　　sales_amount NUMBER(10),
　　sales_date DATE)
　　PARTITION BY LIST(sales_state)(
　　PARTITION sales_west VALUES('California', 'Hawaii'),
　　PARTITION sales_east VALUES ('New York', 'Virginia', 'Florida'),
　　PARTITION sales_central VALUES('Texas', 'Illinois'),
　　PARTITION sales_other VALUES(DEFAULT)
　　);
　　哈希分区
　　用户可以采用哈希分区（hash partitioning）将不适于采用范围分区（range partitioning）或列表分区（list partitioning）的数据进行分区。哈希分区的语法（syntax）简单且易于实现。在以下情况时哈希分区比范围分区更适用：

[*]　　用户无法事先确定一个分区可能存储的数据量
[*]　　各范围分区的容量可能相差很大，或很难通过人工进行平衡
[*]　　采用范围分区可能导致数据不正常的集中
[*]　　应用系统对并行 DML（parallel DML），分区剪除（partition pruning），及基于分区的关联（partition-wise joins）等与性能有关的分区特性要求较高
　　分割（splitting），移除（dropping ），及融合（merging）等操作不适用于哈希分区。但对哈希分区可以进行添加（add）及接合（coalesce）操作。
CREATE TABLE sales_hash(　　salesman_id NUMBER(5),
　　salesman_name VARCHAR2(30),
　　sales_amount NUMBER(10),
　　week_no NUMBER(2))
　　PARTITION BY HASH(salesman_id)
　　PARTITIONS 4
　　STORE IN (ts1, ts2, ts3, ts4);
　　复合分区
　　复合分区（composite partitioning）首先根据范围（range）进行分区，再使用哈希或列表方式创建子分区。复合范围-哈希分区既能够发挥范围分区的可管理性优势，也能够发挥哈希分区的数据分布（data placement），条带化（striping），及并行化（parallelism）优势。复合范围-列表分区能够发挥范围分区的可管理性优势，也能利用列表分区的显示控制能力。
　　复合分区（composite partitioning）便于用户进行与时间相关的维护操作（historical operation），例如添加新的范围分区等。同时复合分区还能够利用子分区（subpartitioning）实现高度的并行 DML 操作，并对数据分布进行精细的控制。
CREATE TABLE sales_composite (　　salesman_id NUMBER(5),
　　salesman_name VARCHAR2(30),
　　sales_amount NUMBER(10),
　　sales_date DATE)
　　PARTITION BY RANGE(sales_date)
　　SUBPARTITION BY HASH(salesman_id)
　　SUBPARTITION TEMPLATE(
　　SUBPARTITION sp1 TABLESPACE ts1,
　　SUBPARTITION sp2 TABLESPACE ts2,
　　SUBPARTITION sp3 TABLESPACE ts3,
　　SUBPARTITION sp4 TABLESPACE ts4)
　　(PARTITION sales_jan2000 VALUES LESS THAN(TO_DATE('02/01/2000','MM/DD/YYYY'))
　　PARTITION sales_feb2000 VALUES LESS THAN(TO_DATE('03/01/2000','MM/DD/YYYY'))
　　PARTITION sales_mar2000 VALUES LESS THAN(TO_DATE('04/01/2000','MM/DD/YYYY'))
　　PARTITION sales_apr2000 VALUES LESS THAN(TO_DATE('05/01/2000','MM/DD/YYYY'))
　　PARTITION sales_may2000 VALUES LESS THAN(TO_DATE('06/01/2000','MM/DD/YYYY')));
　　以下是关于何时应该对表进行分区的一些建议：

[*]　　如果表数据量超过 2GB，就应该考虑进行分区。
[*]　　如果表中包含历史数据，且新数据会被添加到最新的表空间中。典型的例子是一种历史表，其中只有当前月份的数据可以被修改，而其他十一个月的数据为只读。
　　与分区表类似（partitioned table），分区索引（partitioned index）也能够提高系统的可管理性，可用性，可伸缩性，及系统性能。分区索引既可以与分区表相对独立（全局索引（global index）），也可以采用与分区表相同的分区方式（本地索引（local index））。一般来说，OLTP 系统适合采用全局索引，而数据仓库系统或 DSS 系统适合采用本地索引。此外，用户应尽可能地使用本地索引，因为此种索引更易管理。在选择索引类型时，可以参考以下经验：

[*]　　如果表的分区键（partitioning column）是索引键（index key）的子集，应使用本地索引。否则继续参考经验 2。
[*]　　如果索引为唯一索引（unique），应使用全局索引。否则继续参考经验 3。
[*]　　如果用户对可管理性的要求更高，应使用本地索引。否则继续参考经验 4。
[*]　　如果应用系统为 OLTP，且对系统的响应时间要求较高，应使用全局索引。如果应用系统为 DSS，且对系统的数据吞吐量要求较高，应使用本地索引。
　　本地分区索引（local partitioned index）与其他类型分区索引相比较更易管理。本地分区索引适用于 DSS 系统，且具有较高的可用性。这是因为本地分区索引与其所在的分区表采用相同的分区方式：本地分区索引的每个分区都与分区表的一个分区相对应。因此，Oracle 能够自动地确保各个索引分区与相应的表分区同步，且使各个表-索引分区对（table-index pair）相互独立。当一个表分区内的数据发生变化时，只会影响一个索引分区。

页: [1]

运维网's Archiver

oracle分区技术