开发人员的噩梦——删除重复记录
想必每一位开发人员都有过类似的经历在对数据库进行查询或统计的时候不时地会碰到由于表中存在重复的记录而导致查询和统计结果不准确解决该问题的办法就是将这些重复的记录删除只保留其中的一条
在SQL Server中除了对拥有十几条记录的表进行人工删除外实现删除重复记录一般都是写一段代码用游标的方法一行一行检查删除重复的记录因为这种方法需要对整个表进行遍历所以对于表中的记录数不是很大的时候还是可行的如果一张表的数据达到上百万条用游标的方法来删除简直是个噩梦因为它会执行相当长的一段时间
四板斧——轻松消除重复记录
殊不知在SQL Server中有一种更为简单的方法它不需要用游标只要写一句简单插入语句就能实现删除重复记录的功能为了能清楚地表述我们首先假设存在一个产品信息表Products其表结构如下 CREATE TABLE Products (
ProductID int
ProductName nvarchar ()
Unit char()
UnitPrice money
)
产品Chang和Tofu的记录在产品信息表中存在重复现在要删除这些重复的记录只保留其中的一条步骤如下
第一板斧——建立一张具有相同结构的临时表
CREATE TABLE Products_temp (
ProductID int
ProductName nvarchar ()
Unit char()
UnitPrice money
)
第二板斧——为该表加上索引并使其忽略重复的值
方法是在企业管理器中找到上面建立的临时表Products _temp单击鼠标右键选择所有任务选择管理索引选择新建一个索引然后选择“唯一值”选择“忽略重复值”
第三板斧——拷贝产品信息到临时表
insert into Products_temp Select * from Products
此时SQL Server会返回如下提示
服务器: 消息 级别 状态 行
已忽略重复的键
它表明在产品信息临时表Products_temp中不会有重复的行出现
第四板斧——将新的数据导入原表
将原产品信息表Products清空并将临时表Products_temp中数据导入最后删除临时表Products_temp
delete Products
insert into Products select * from Products_temp
drop table Products_temp
这样就完成了对表中重复记录的删除无论表有多大它的执行速度都是相当快的而且因为几乎不用写语句所以它也是很安全的
小提示上述方法中删除重复记录取决于创建唯一索引时选择的字段在实际的操作过程中读者务必首先确认创建的唯一索引字段是否正确以免将有用的数据删除