在Oracle数据库中创建索引虽然比较简单但是要合理的创建索引则比较困难了笔者认为在创建索引时要做到三个适当即在适当的表上适当的列上创建适当数量的索引虽然这可以通过一句话来概括优化的索引的基本准则但是要做到这一点的话需要数据库管理员做出很大的努力具体的来说要做到这个三个适当有如下几个要求
一 根据表的大小来创建索引
虽然给表创建索引可以提高查询的效率但是数据库管理员需要注意的是索引也需要一定的开销的为此并不是说给所有的表都创建索引那么就可以提高数据库的性能这个认识是错误的恰恰相反如果不管三七二十一给所有的表都创建了索引那么其反而会给数据库的性能造成负面的影响因为此时滥用索引的开销可能已经远远大于由此带来的性能方面的收益所以笔者认为数据库管理员首先需要做到为合适的表来建立索引而不是为所有的表建立索引
一般来说不需要为比较小的表创建索引如在一个ERP系统的数据库中department表用来存储企业部门的信息一般企业的部分也就十几个最多不会超过一百个这条记录对于人来说可能算是比较多了但是对于计算机来说这给他塞塞牙缝都还不够所以对类似的小表没有必要建立索引因为即使建立了索引其性能也不会得到很大的改善相反索引建立的开销如维护成本等等要比这个要大也就是说付出的要比得到的多显然违反常理
另外就是对于超大的表也不一定要建立索引有些表虽然比较大记录数量非常的多但是此时为这个表建立索引并一定的合适如系统中有一张表其主要用来保存数据库中的一些变更信息往往这些信息只给数据库管理员使用此时为这张表建立索引的话反而不合适因为这张表很少用到只有在出问题的时候才需要查看其次其即使查看需要查询的纪录也不会很多可能就是最近一周的更新记录等等对于对于一些超大的表建立索引有时候往往不能够达到预计的效果而且在打表上建立索引其索引的开销要比普通的表大的多那么到底是否给大表建立索引呢?笔者认为主要是看两个方面的内容首先是需要关注一下在这张大表中经常需要查询的记录数量一般来说如果经常需要查询的数据不超过%到%的话那就没有必要为其建立索引的必要因为此时建立索引的开销可能要比性能的改善大的多这个比例只是一个经验的数据如果数据库管理员需要得出一个比较精确的结论那么就需要进行测试分析即数据库管理员需要测试一下全表扫描的时间看看其是否比建立索引后的查询时间要长或者短如果是长的话则说明有建立索引的必要但是如果没有的话则说明还是全表扫描速度来的快此时也就没有必要建立索引了
总之在考虑是否该为表建立索引时一般来说小表没有建立索引的必要而对于打表的话则需要进行实际情况实际分析简单一点的可以根据大致的比率来确定如果要精确一点的则可以进行全表扫描性能分析以判断建立索引后是否真的如预期那样改善了数据库性能
二 根据列的特征来创建索引
列的特点不同索引创建的效果也不同数据库管理员需要了解为哪些列创建索引可以起到事倍功半的效果同时也需要了解为哪些列创建索引反而起到的是事倍功半的效果这有利于他们了解到底给为怎么样的字段建立索引
根据笔者的经验往往为如下特征的列创建索引能够起到比较明显的效果如对于一些重复内容比较少的列特别是对于那些定义了唯一约束的列在这些列上建立索引往往可以起到非常不错的效果如对于一些null值的列与非Null值的列混合情况下如果用户需要经常查询所有的非Null值记录的列则最好为其设置索引如果经常需要多表连接查询在用与连接的列上设置索引可以达到事半功倍的效果
可见索引设置的是否恰当不仅跟数据库设计架构有关而且还跟企业的经济业务相关为此对于一些套装软件虽然一开始数据库管理员已经做了索引的优化工作但是随着后来经济数据的增加这个索引的效果会越来越打折扣这主要是因为记录的表化影响到了索引优化的效果所以笔者建议各位数据库管理员即使采用的是大牌软件公司的套装软件也需要隔一段时间如一年对数据库的索引进行优化该去掉的去掉该调整的调整以提高数据库的性能
如在数据库中有一张表是用来保存用户信息的其中有个字段身份证号码这是一个唯一的字段在数据库设计时给这个字段创建了索引但是当这个数据库投入使用之后用户不怎么输入用户的身份证号码而且平时也基本不按这个号码来进行查询当记录月来月多时这个身份证号码上的索引字段不但不能够改善数据库的查询性能反而成了鸡肋对于这些有很多NULL值的列而且不会经常查询所有的非NULL值记录的列数据库管理员要下决心即使清除这些列上的索引
所以说索引的优化与调整是一个动态的过程并不是说数据库设计好之后就不需要经过调整数据库管理员往往需要根据记录的变化情况来进行适当的变更以提高索引的效果
三 在一个表上创建多少索引合适?
虽然说在表上创建索引的数量没有限制但是决不是越多越好也就是说在创建索引这项事情上+〉往往不成立有时候创建索引越多其可能会得到适得其反的效果那么在一个表上到底给创建多少索引合适呢?这个没有一个明确的标准而是需要数据库管理员根据实际的用途以及数据库中记录的情况来进行判断
通常来说表的索引越多其查询的速度也就越快但是表的更新速度则会降低这主要是因为表的更新(如往表中插入一条记录)速度反而随着索引的增加而增加这主要是因为在更新记录的同时需要更新相关的索引信息为此到底在表中创建多少索引合适就需要在这个更新速度与查询速度之间取得一个均衡点如对于一些数据仓库或者决策型数据库系统其主要用来进行查询相关的记录往往是在数据库初始化的时候倒入此时设置的索引多一点可以提高数据库的查询性能同时因为记录不怎么更新所以索引比较多的情况下也不会影响到更新的速度即使在起初的时候需要导入大量的数据此时也可以先将索引禁用掉等到数据导入完毕后再启用索引可以通过这种方式来减少索引对数据更新的影响相反如果那些表中经常需要更新记录如一些事务型的应用系统数据更新操作是家常便饭的事情此时如果在一张表中建立过多的索引则会影响到更新的速度由于更新操作比较频繁所以对其的负面影响要比查询效率提升要大的多此时就需要限制索引的数量只在一些必要的字段上建立索引
笔者在平时数据库优化时往往会根据这些表的用途来为列设置索引可以查询相关的动态视图看看对于这张表的操作是更新操作(包括更新删除插入等等)占的比例大还是查询操作占的比例大当过多的索引已经影响到更新操作的速度时则数据库管理员就需要先禁用某些索引以提高数据库的性能
总之在适当的表适当的列上建立适当的索引这一句话包含的意思有很多以上内容只是一部分内容俗话说师傅领进门修行靠自身笔者在这里指能够点到为止一些具体的索引优化内容还是需要各位读者在日常工作中去体会与总结