作者: 佘涛
对于像Sybase这样的大型DBMS系统而言作为OLTP(联机事务处理)应用的基石它需要能每天小时每年天不间断运行由于其应用程序每天对数据库进行大量的插入更新删除等操作在数据库的物理存储介质上产生了大量存储碎片从而影响了存储的效率以及数据库应用运行的速度是否可以像Windows操作系统的碎片整理程序一样整理这些碎片从而优化数据库存储提高数据库的运行速度呢?答案是肯定的本文将介绍Sybase数据库的碎片类型以及碎片整理方法
碎片类型
由于Sybase是通过OAM页分配单元和扩展页来管理数据的所以对OLTP应用的Database Server会十分频繁地进行数据删除插入和更新等操作时间一长就会出现以下几种情况
页碎片
即本来可以存放在一个页上的数据却分散地存储在多个页上如果这些页存储在不同的扩展单元上Database Server就要访问多个扩展单元因此降低了系统性能
扩展单元碎片
在堆表中当删除数据链中间的记录行时会出现空页随着空页的累积扩展单元的利用率也会下降从而出现扩展单元碎片带cluster index的table也有可能出现扩展单元碎片
当有扩展单元碎片存在会出现以下问题
● 对表进行处理时常常出现死锁
● 利用较大的I/O操作或增加I/O缓沖区的大小也无法改变较慢的I/O速度
● 行操作的争用
扩展单元遍历
带有cluster index的table会由于插入记录而导致页分裂但当删除记录后页会获得释放从而形成跨几个扩展单元和分配单元的数据而要访问该数据就必须遍历几个扩展单元和分配单元这将导致访问/查询记录的时间大大延长开始时数据库的性能虽然较高但使用一段时间后性能就会下降等问题
实际上数据在存储空间上排列得越紧密有序Database Server访问的速度就越快消除碎片有助于提高系统的性能和更有效地利用数据存储空间
碎片优化方法
处理碎片有多种方法如重新定义table的填充因子根据table的定义删除并重新创建索引重建表等
本文给出的方法是通过BCP实用程序将用户数据库的数据以文本形式导出然后将用户数据库彻底清空截断再将文本数据导入到数据库从而达到消除碎片的目的具有通用性
下面以Sun Solaris 操作系统下的Sybase Adaptive Server Enterprise 为例说明整理数据库数据的具体方法
备份数据库
为防止在数据库碎片整理过程中出现不可预见的问题有必要先备份数据库
创建bcp out脚本并导出数据
● 创建包含下列SQL语句的文件
cre_bcp_outsql
select bcp + name + out / + name + _outtxt Udboname Pdbopwd Ssys_name c
from sysobjects where type = U
order by name
go
● isql Udboname Pdbopwd Ssystemname < cre_bcp_out. sql > b_out
● 编辑输出文件去掉文件第一行和最后两行无关的字符vi b_out
● 执行脚本将数据库的数据导出到文本文件sh b_out
创建truncate table脚本并截断数据库
● 创建包含下列SQL语句的文件
cre_trunc_outsql
select truncate table + name from sysobjects where type = U
order by name
go
● isql Udboname Pdbopwd Ssystemname < cre_ trunc_out. sql > trunc_out sql
● 编辑输出文件去掉文件第一行和最后两行无关的字符并在最后一行加入 go构成完整的SQL语句vi trunc_out
● 执行以下语句清空数据库的数据
isql Udboname Pdbopwd < trunc_out. sql
4. 创建bcp in脚本并导入数据
● 创建包含下列SQL语句的文件:
cre_bcp_in. sql
select “bcp” + name + “in ./” + name + “_out.txt -Udboname -Pdbopwd -Ssys_name -c”from sysobjects where type = ‘U’
order by name
go
● isql -Udboname -Pdbopwd -Ssystemname < cre_ bcp_in. sql > b_in
● 编辑输出文件,去掉文件第一行和最后两行无关的字符:vi b_in
● 从文本中导入数据:sh b_in
5. 更新数据库状态
Sybase不自动维护索引的统计信息,当用truncate table截断数据库时,索引并没有改变,所以必须用update statistics来确保索引的统计信息对应当前表数据的统计。Tw.wiNgwit.CoM
● 创建包含下列SQL语句的文件:
cre_upd_st. sql
select “update statistics” + name from sysobjects where type = “U” order by name
go
● isql -Udboname -Pdbopasswd -Ssystemname < cre_upd_st. sql > upd_st. sql
● 编辑输出文件,去掉文件第一行和最后两行无关的字符,在最后一行加入 go构成完整的SQL语句:
vi upd_st. sql
● 更新数据库状态:
isql -Udboname -Pdbopasswd -Ssystemname < upd_st. sql
至此,基本上完成了数据库用户表的碎片整理工作。
小 结
在整理过程中,有以下两点需要注意:
1. Tempdb的大小
当Sybase执行bcp in脚本时,会占用导入数据2倍的tempdb空间,因此在执行前要仔细估计最大的table的大小,保证有足够的tempdb空间。当空间不够时,要考虑用分割table或删除陈旧数据的方法缩小table的大小,或者考虑增加tempdb的大小。
2. 数据库配置选项的设置
当数据库执行bcp in脚本时会产生大量的log,为保证bcp in进程不致因为log溢出而中断,应该设置database的选项“truncate log on chkpt”为“true”。
虽然Sybase数据库是自优化的,但只要数据库是动态的,数据库碎片现象就会存在。在OLTP应用的场合,随着数据的不断增大,系统变得越来越缓慢,并且经常出现死锁时,应该检查数据库的碎片,并且采用以上方法进行优化。
实际上,应该定期做数据库的碎片整理,保证数据库的物理存储经常处于最优状态,相对于增加硬件而言,这是一种更好的保持数据库性能的低成本的途径。