用索引提高效率
索引是表的一个概念部分用来提高检索数据的效率 实际上ORACLE使用了一个复杂的自平衡Btree结构通常通过索引查询数据比全表扫描要快 当ORACLE找出执行查询和Update语句的最佳路径时 ORACLE优化器将使用索引同样在联结多个表时使用索引也可以提高效率 另一个使用索引的好处是它提供了主键(primary key)的唯一性验证
除了那些LONG或LONG RAW数据类型 你可以索引几乎所有的列 通常 在大型表中使用索引特别有效 当然你也会发现 在扫描小表时使用索引同样能提高效率
虽然使用索引能得到查询效率的提高但是我们也必须注意到它的代价 索引需要空间来存储也需要定期维护每当有记录在表中增减或索引列被修改时 索引本身也会被修改 这意味着每条记录的INSERT DELETE UPDATE将为此多付出 次的磁盘I/O 因为索引需要额外的存储空间和处理那些不必要的索引反而会使查询反应时间变慢
译者按定期的重构索引是有必要的
ALTER INDEX REBUILD
索引的操作
ORACLE对索引有两种访问模式
索引唯一扫描 ( INDEX UNIQUE SCAN)
大多数情况下 优化器通过WHERE子句访问INDEX
例如
表LODGING有两个索引 建立在LODGING列上的唯一性索引LODGING_PK和建立在MANAGER列上的非唯一性索引LODGING$MANAGER
SELECT*
FROMLODGING
WHERELODGING=ROSEHILL;
在内部 上述SQL将被分成两步执行 首先 LODGING_PK 索引将通过索引唯一扫描的方式被访问 获得相对应的ROWID 通过ROWID访问表的方式执行下一步检索
如果被检索返回的列包括在INDEX列中ORACLE将不执行第二步的处理(通过ROWID访问表) 因为检索数据保存在索引中 单单访问索引就可以完全满足查询结果
下面SQL只需要INDEX UNIQUE SCAN 操作
SELECTLODGING
FROMLODGING
WHERELODGING=ROSEHILL;
索引范围查询(INDEX RANGE SCAN)
适用于两种情况
基于一个范围的检索
基于非唯一性索引的检索
例
SELECTLODGINGFROMLODGINGWHERELODGINGLIKEM%;
WHERE子句条件包括一系列值 ORACLE将通过索引范围查询的方式查询LODGING_PK 由于索引范围查询将返回一组值 它的效率就要比索引唯一扫描低一些
例
SELECTLODGING
FROMLODGING
WHEREMANAGER=BILLGATES;
这个SQL的执行分两步 LODGING$MANAGER的索引范围查询(得到所有符合条件记录的ROWID)和下一步同过ROWID访问表得到LODGING列的值 由于LODGING$MANAGER是一个非唯一性的索引数据库不能对它执行索引唯一扫描
由于SQL返回LODGING列而它并不存在于LODGING$MANAGER索引中 所以在索引范围查询后会执行一个通过ROWID访问表的操作
WHERE子句中 如果索引列所对应的值的第一个字符由通配符(WILDCARD)开始 索引将不被采用在这种情况下ORACLE将使用全表扫描
SELECTLODGING
FROMLODGING
WHEREMANAGERLIKE%HANMAN;
基础表的选择
基础表(Driving Table)是指被最先访问的表(通常以全表扫描的方式被访问) 根据优化器的不同 SQL语句中基础表的选择是不一样的
如果你使用的是CBO (COST BASED OPTIMIZER)优化器会检查SQL语句中的每个表的物理大小索引的状态然后选用花费最低的执行路径
如果你用RBO (RULE BASED OPTIMIZER) 并且所有的连接条件都有索引对应 在这种情况下 基础表就是FROM 子句中列在最后的那个表blog
举例
SELECTANAMEBMANAGER
FROMWORKERA
LODGINGB
WHEREALODGING=BLODING;
由于LODGING表的LODING列上有一个索引 而且WORKER表中没有相比较的索引 WORKER表将被作为查询中的基础表