文档详情

SQL查询重复数据和清除重复数据.doc

发布：2017-02-04约8千字共6页下载文档

文本预览下载声明

SQL查询重复数据和清除重复数据分类： SQL 2008-05-20 11:03 34086人阅读评论(1) 收藏举报 sqlsqlserversunjoin 选择重复，消除重复和选择出序列有例表：emp emp_no name age 001 Tom 17 002 Sun 14 003 Tom 15 004 Tom 16 要求：列出所有名字重复的人的记录 (1)最直观的思路：要知道所有名字有重复人资料，首先必须知道哪个名字重复了： select name from emp group by name having count(*)1 所有名字重复人的记录是: select * from emp where name in (select name from emp group by name having count(*)1) (2)稍微再聪明一点，就会想到，如果对每个名字都和原表进行比较，大于2个人名字与这条记录相同的就是合格的，就有 select * from emp where (select count(*) from emp e where e.name=emp.name) 1 注意一下这个1，想下如果是 =1，如果是 =2 如果是2 如果 e 是另外一张表而且是=0那结果就更好玩了:) 这个过程是在判断工号为001的人的时候先取得 001的名字（emp.name）然后和原表的名字进行比较 e.name 注意e是emp的一个别名。再稍微想得多一点，就会想到，如果有另外一个名字相同的人工号不与她他相同那么这条记录符合要求： select * from emp where exists (select * from emp e where e.name=emp.name and e.emp_noemp.emp_no) 此思路的join写法： select emp.* from emp,emp e where emp.name=e.name and emp.emp_noe.emp_no /* 这个语句较规范的 join 写法是 select emp.* from emp inner join emp e on emp.name=e.name and emp.emp_noe.emp_no 但个人比较倾向于前一种写法，关键是更清晰 */ b、有例表：emp name age Tom 16 Sun 14 Tom 16 Tom 16 清除重复过滤掉所有多余的重复记录 (1)我们知道distinct、group by 可以过滤重复，于是就有最直观的 select distinct * from emp 或 select name,age from emp group by name,age 获得需要的数据，如果可以使用临时表就有解法： select distinct * into #tmp from emp delete from emp insert into emp select * from #tmp (2)但是如果不可以使用临时表，那该怎么办？我们观察到我们没办法区分数据（物理位置不一样，对 SQL Server来说没有任何区别），思路自然是想办法把数据区分出来了，既然现在的所有的列都没办法区分数据，唯一的办法就是再加个列让它区分出来，加什么列好？最佳选择是identity列： alter table emp add chk int identity(1,1) 表示例： name age chk Tom 16 1 Sun

显示全部

相似文档