我们知道PL/SQL程序中运行SQL语句是存在开销的因为SQL语句是要提交给SQL引擎处理这种在PL/SQL引擎和SQL引擎之间的控制转移叫做上下文却换每次却换时都有额外的开销请看下图 但是FORALL和BULK COLLECT可以让PL/SQL引擎把多个上下文却换压缩成一个这使得在PL/SQL中的要处理多行记录的SQL语句执行的花费时间骤降 请再看下图 下面详解这爷俩 ㈠ 通过BULK COLLECT 加速查询 ⑴ BULK COLLECT 的用法 采用BULK COLLECT可以将查询结果一次性地加载到collections中而不是通过cursor一条一条地处理 可以在select into fetch into returning into语句使用BULK COLLECT 注意在使用BULK COLLECT时所有的INTO变量都必须是collections 举几个简单例子 ① 在select into语句中使用bulk collect [sql] DECLARE TYPE sallist IS TABLE OF employeessalary%TYPE; sals sallist; BEGIN SELECT salary BULK COLLECT INTO sals FROM employees where rownum<=; 接下来使用集合中的数据 END; / ② 在fetch into中使用bulk collect [sql] DECLARE TYPE deptrectab IS TABLE OF departments%ROWTYPE; dept_recs deptrectab; CURSOR cur IS SELECT department_iddepartment_name FROM departments where department_id>; BEGIN OPEN cur; FETCH cur BULK COLLECT INTO dept_recs; 接下来使用集合中的数据 END; / ③ 在returning into中使用bulk collect [sql] CREATE TABLE emp AS SELECT * FROM employees; DECLARE TYPE numlist IS TABLE OF employeesemployee_id%TYPE; enums numlist; TYPE namelist IS TABLE OF employeeslast_name%TYPE; names namelist; BEGIN DELETE emp WHERE department_id= RETURNING employee_idlast_name BULK COLLECT INTO enumsnames; DBMS_OUTPUTPUT_LINE(deleted||SQL%ROWCOUNT||rows:) FOR i IN enumsFIRST enumsLAST LOOP DBMS_OUTPUTPUT_LINE(employee#||enums(i)||:||names(i)) END LOOP; END; / deletedrows: employee#:Raphaely employee#:Khoo employee#:Baida employee#:Tobias employee#:Himuro employee#:Colmenares ⑵ BULK COLLECT 对大数据DELETE UPDATE的优化 这里举DELETE就可以了UPDATE同理 举个案例 需要在一个亿行的大表中删除千万行数据 需求是在对数据库其他应用影响最小的情况下以最快的速度完成 如果业务无法停止的话可以参考下列思路 根据ROWID分片再利用Rowid排序批量处理回表删除 在业务无法停止的时候选择这种方式的确是最好的 一般可以控制在每一万行以内提交一次不会对回滚段造成太大压力 我在做大DML时通常选择一两千行一提交 选择业务低峰时做对应用也不至于有太大影响 代码如下 [sql] DECLARE 按rowid排序的cursor 删除条件是oo=xx这个需根据实际情况来定 CURSOR mycursor IS SELECT rowid FROM t WHERE OO=XX ORDER BY rowid; TYPE rowid_table_type IS TABLE OF rowid index by pls_integer; v_rowid rowid_table_type; BEGIN OPEN mycursor; LOOP FETCH mycursor BULK COLLECT INTO v_rowid LIMIT ;行提交一次 EXIT WHEN unt=; FORALL i IN v_rowidFIRSTv_rowidLAST DELETE t WHERE rowid=v_rowid(i) COMMIT; END LOOP; CLOSE mycursor; END; / ⑶ 限制BULK COLLECT 提取的记录数 语法 FETCH cursor BULK COLLECT INTO …[LIMIT rows]; 其中rows可以是常量变量或者求值的结果是整数的表达式 假设你需要查询并处理W行数据你可以用BULK COLLECT一次取出所有行然后填充到一个非常大的集合中 可是这种方法会消耗该会话的大量PGAAPP可能会因为PGA换页而导致性能下降 这时LIMIT子句就非常有用它可以帮助我们控制程序用多大内存来处理数据 例子 [sql] DECLARE CURSOR allrows_cur IS SELECT * FROM employees; TYPE employee_aat IS TABLE OF allrows_cur%ROWTYPE INDEX BY BINARY_INTEGER; v_emp employee_aat; BEGIN OPEN allrows_cur; LOOP FETCH allrows_cur BULK FETCH INTO v_emp LIMIT ; /*通过扫描集合对数据进行处理*/ FOR i IN unt LOOP upgrade_employee_status(v_emp(i)employee_id) END LOOP; EXIT WHEN allrows_cur%NOTFOUND; END LOOP; CLOSE allrows_cur; END; / ⑷ 批量提取多列 需求 提取transportation表中的油耗小于 公里/RMB的交通具体的全部信息 代码如下 [sql] DECLARE 声明集合类型 TYPE vehtab IS TABLE OF transportation%ROWTYPE; 初始化一个这个类型的集合 gas_quzzlers vehtab; BEGIN SELECT * BULK COLLECT INTO gas_quzzlers FROM transportation WHERE mileage < ; … ⑸ 对批量操作使用RETURNING子句 有了returning子句后我们可以轻松地确定刚刚完成的DML操作的结果无须再做额外的查询工作 例子请见BULK COLLECT 的用法的第三小点 ㈡ 通过FORALL 加速DML FORALL告诉PL/SQL引擎要先把一个或多个集合的所有成员都绑定到SQL语句中然后再把语句发送给SQL引擎 |