dbms_stats能良好地估计统计数据(尤其是针对较大的分区表)并能获得更好的统计结果最终制定出速度更快的SQL执行计划
exec dbms_statsgather_schema_stats(
ownname => SCOTT
options => GATHER AUTO
estimate_percent => dbms_statsauto_sample_size
method_opt => for all columns size repeat
degree =>
) 为了充分认识dbms_stats的好处需要仔细体会每一条主要的预编译指令(directive)下面让我们研究每一条指令并体会如何用它为基于代价的SQL优化器收集最高质量的统计数据
options参数
使用个预设的方法之一这个选项能控制Oracle统计的刷新方式
gather——重新分析整个架构(Schema)
gather empty——只分析目前还没有统计的表
gather stale——只重新分析修改量超过%的表(这些修改包括插入更新和删除)
gather auto——重新分析当前没有统计的对象以及统计数据过期(变髒)的对象注意使用gather auto类似于组合使用gather stale和gather empty
注意无论gather stale还是gather auto都要求进行监视如果你执行一个alter table xxx monitoring命令Oracle会用dba_tab_modifications视图来跟蹤发生变动的表这样一来你就确切地知道自从上一次分析统计数据以来发生了多少次插入更新和删除操作
estimate_percent选项
estimate_percent参数是一种比较新的设计它允许Oracle的dbms_stats在收集统计数据时自动估计要采样的一个segment的最佳百分比
estimate_percent => dbms_statsauto_sample_size
要验证自动统计采样的准确性你可检视dba_tables sample_size列一个有趣的地方是在使用自动采样时Oracle会为一个样本尺寸选择到的百分比记住统计数据质量越好CBO做出的决定越好
method_opt选项
method_optfor table 只统计表
for all indexed columns 只统计有索引的表列
for all indexes 只分析统计相关索引
for all columns
dbms_stats的method_opt参数尤其适合在表和索引数据发生变化时刷新统计数据method_opt参数也适合用于判断哪些列需要直方图(histograms)
某些情况下索引内的各个值的分布会影响CBO是使用一个索引还是执行一次全表扫描的决策例如假如在where子句中指定的值的数量不对称全表扫描就显得比索引访问更经济
如果你有一个高度倾斜的索引(某些值的行数不对称)就可创建Oracle直方图统计但在现实世界中出现这种情况的机率相当小使用CBO时最常见的错误之一就是在CBO统计中不必要地引入直方图根据经验只有在列值要求必须修改执行计划时才应使用直方图
为了智能地生成直方图Oracle为dbms_stats准备了method_opt参数在method_opt子句中还有一些重要的新选项包括skewonlyrepeat和auto
method_opt=>for all columns size skewonly
method_opt=>for all columns size repeat
method_opt=>for all columns size auto
skewonly选项会耗费大量处理时间因为它要检查每个索引中的每个列的值的分布情况
假如dbms_stat发现一个索引的各个列分布得不均匀就会为那个索引创建直方图帮助基于代价的SQL优化器决定是进行索引访问还是进行全表扫描访问例如在一个索引中假定有一个列在%的行中如清单B所示那么为了检索这些行全表扫描的速度会快于索引扫描
*************************************************************
SKEWONLY option—Detailed analysis
Use this method for a firsttime analysis for skewed indexes
This runs a long time because all indexes are examined
*************************************************************
begin
dbms_statsgather_schema_stats(
ownname => SCOTT
estimate_percent => dbms_statsauto_sample_size
method_opt => for all columns size skewonly
degree =>
);
end;
重新分析统计数据时使用repeat选项重新分析任务所消耗的资源就会少一些使用repeat选项(清单C)时只会为现有的直方图重新分析索引不再搜索其他直方图机会定期重新分析统计数据时你应该采取这种方式
**************************************************************
REPEAT OPTION Only reanalyze histograms for indexes
that have histograms
Following the initial analysis the weekly analysis
job will use the repeat option The repeat option
tells dbms_stats that no indexes have changed and
it will only reanalyze histograms for
indexes that have histograms
**************************************************************
begin
dbms_statsgather_schema_stats(
ownname => SCOTT
estimate_percent => dbms_statsauto_sample_size
method_opt => for all columns size repeat
degree =>
);
end;
使用alter table xxx monitoring;命令来实现Oracle表监视时需要使用dbms_stats中的auto选项如清单D所示auto选项根据数据分布以及应用程序访问列的方式(例如通过监视而确定的一个列的工作量)来创建直方图使用method_opt=>auto类似于在dbms_stats的option参数中使用gather auto
begin
dbms_statsgather_schema_stats(
ownname => SCOTT
estimate_percent => dbms_statsauto_sample_size
method_opt => for all columns size auto
degree =>
);
end;
并行统计收集degree参数
Oracle推荐设置DBMS_STATS的DEGREE参数为DBMS_STATSAUTO_DEGREE该参数允许Oracle根据对象的大小和并行性初始化参数的设置选择恰当的并行度
聚簇索引域索引位图连接索引不能并行收集
如何使用dbms_stats分析统计信息?
创建统计信息历史保留表
sql> exec dbms_statscreate_stat_table(ownname => scottstattab => stat_table) ;
导出整个scheme的统计信息
sql> exec dbms_statsexport_schema_stats(ownname => scottstattab => stat_table) ;
分析scheme
Exec dbms_statsgather_schema_stats(
ownname => scott
options => GATHER AUTO
estimate_percent => dbms_statsauto_sample_size
method_opt => for all indexed columns
degree => )
分析表
sql> exec dbms_statsgather_table_stats(ownname => scotttabname => work_listestimate_percent => method_opt=> for all indexed columns) ;
分析索引
SQL> exec dbms_statsgather_index_stats(ownname => crmindname => IDX_ADM_PERMISSION_PID_MIDestimate_percent => degree => ) ;
如果发现执行计划走错删除表的统计信息
SQL>dbms_statsdelete_table_stats(ownname => scotttabname => work_list) ;
导入表的历史统计信息
sql> exec dbms_statsimport_table_stats(ownname => scotttabname => work_liststattab => stat_table) ;
如果进行分析后大部分表的执行计划都走错需要导回整个scheme的统计信息
sql> exec dbms_statsimport_schema_stats(ownname => scottstattab => stat_table);
导入索引的统计信息
SQL> exec dbms_statsimport_index_stats(ownname => crmindname => IDX_ADM_PERMISSION_PID_MIDstattab => stat_table)
检查是否导入成功
SQL> select table_namenum_rowsablocksalast_analyzed from all_tables a where atable_name=WORK_LIST;
分析数据库(包括所有的用户对象和系统对象)gather_database_stats
分析用户所有的对象(包括表索引簇)gather_schema_stats
分析表gather_table_stats
分析索引gather_index_stats
删除数据库统计信息delete_database_stats
删除用户方案统计信息delete_schema_stats
删除表统计信息delete_table_stats
删除索引统计信息delete_index_stats
删除列统计信息delete_column_stats
设置表统计信息set_table_stats
设置索引统计信息set_index_stats
设置列统计信息set_column_stats
从Oracle Database g开始Oracle在建库后就默认创建了一个名为GATHER_STATS_JOB的定时任务用于自动收集CBO的统计信息
这个自动任务默认情况下在工作日晚上和周末全天开启调用DBMS_STATSGATHER_DATABASE_STATS_JOB_PROC收集统计信息
该过程首先检测统计信息缺失和陈旧的对象然后确定优先级再开始进行统计信息
可以通过以下查询这个JOB的运行情况
select * from Dba_Scheduler_Jobs where JOB_NAME =GATHER_STATS_JOB
其实同在点运行的Job还有一个AUTO_SPACE_ADVISOR_JOB
SQL> select JOB_NAMELAST_START_DATE from dba_scheduler_jobs;
JOB_NAME LAST_START_DATE
AUTO_SPACE_ADVISOR_JOB DEC PM +:
GATHER_STATS_JOB DEC PM +:
FGR$AUTOPURGE_JOB
PURGE_LOG DEC AM PRC
然而这个自动化功能已经影响了很多系统的正常运行晚上点对于大部分生产系统也并非空闲时段
而自动分析可能导致极为严重的闩锁竞争进而可能导致数据库Hang或者Crash
所以建议最好关闭这个自动统计信息收集功能
方法之一:
exec dbms_schedulerdisable(SYSGATHER_STATS_JOB);
恢复自动分析:
exec dbms_schedulerenable(SYSGATHER_STATS_JOB);
方法二
alter system set _optimizer_autostats_job=false scope=spfile;
alter system set _optimizer_autostats_job=true scope=spfile;
Pfile可以直接修改初始化参数文件重新启动数据库