数据库

位置:IT落伍者 >> 数据库 >> 浏览文章

详解如何删除SQL Server表中的重复行


发布日期:2021年05月12日
 
详解如何删除SQL Server表中的重复行

如果表中有多组完全不同的重复的 PK 值则逐个删除它们会很费时间在这种情况下可使用下面的方法

首先运行上面的 GROUP BY 查询来确定有多少组重复的 PK 值及每组的重复数

选择重复的键值放入临时表中例如

SELECT col col col=count(*) INTO holdkey FROM t GROUP BY col col HAVING count(*) >

选择重复的行放入临时表中以清除进程中的重复值例如

SELECT DISTINCT t* INTO holddups FROM t holdkey WHERE tcol = holdkeycol AND tcol = holdkeycol

此时holddups 表应有唯一的 PK;但是如果 t 有重复的 PK 而行唯一(如上面的 SSN 示例)情况就不是这样了请验证 holddups 中的各个键是否唯一是否没有键重复而行唯一的情况如果是这样您必须停在该处确定对于给定重复的键值您希望保留哪些行例如以下查询

SELECT col col count(*) FROM holddups GROUP BY col col

应为各行返回计数 如果结果是 请继续执行下面的步骤 如果不是 则存在键重复而行唯一的情况且需要您决定要保存哪些行通常这将需要捨弃行或为此行创建新的唯一的键值为 holddups 表中每个此种重复 PK 执行这两个步骤之一

从原始表中删除重复的行例如

DELETE t FROM t holdkey WHERE tcol = holdkeycol AND tcol = holdkeycol

将唯一行放回原始表中例如

INSERT t SELECT * FROM holddups

上一篇:并行查询让SQL Server加速运行

下一篇:三招解决SQL Server数据库权限沖突