AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / dba / 问题 / 89171
Accepted
Ed Elliott
Ed Elliott
Asked: 2015-01-14 07:34:50 +0800 CST2015-01-14 07:34:50 +0800 CST 2015-01-14 07:34:50 +0800 CST

从不同的列中删除重复项

  • 772

我正在尝试从一组中删除重复项,但重复项位于不同的列中,例如使用此表:

ColA, ColB, ColC, ColD
----------
1,  1, 'ABC', 'DEF'
----------
1,  1, 'DEF', 'ABC'
----------
1,  1, 'GHJ', 'LKJ'
----------
1,  1, 'LKJ', 'GHJ'

我需要结束的是:

ColA, ColB, ColC, ColD
----------
1,  1, 'ABC', 'DEF'
1,  1, 'GHJ', 'LKJ'

希望这是有道理的,有没有人有任何想法?

这是 SQL-Server 2012。

sql-server sql-server-2012
  • 3 3 个回答
  • 1168 Views

3 个回答

  • Voted
  1. Best Answer
    Evaldas Buinauskas
    2015-01-14T11:10:03+08:002015-01-14T11:10:03+08:00

    这可能不是正确答案,但这适用于您提供给我们的数据。

    ;WITH TestData (ColA, ColB, ColC, ColD)
    AS (
        SELECT 1, 1, 'ABC', 'DEF'
        UNION ALL
        SELECT 1, 1, 'DEF', 'ABC'
        UNION ALL
        SELECT 1, 1, 'GHJ', 'LKJ'
        UNION ALL
        SELECT 1, 1, 'LKJ', 'GHJ'
        UNION ALL
        SELECT 1, 1, 'ABC', 'HJK'
        UNION ALL
        SELECT 1, 1, 'HJK', 'ABC'
    )
    SELECT ColA, ColB, ColC, ColD
    FROM TestData
    EXCEPT
    SELECT ColA, ColB, ColD, ColC
    FROM TestData
    WHERE ColC < ColD
    
    • 4
  2. MickyT
    2015-01-14T11:55:40+08:002015-01-14T11:55:40+08:00

    这是一种相当复杂的方法,我相信可能有更好的方法,但它可以适应处理更多的列。

    SELECT DISTINCT 
        ColA
        , ColB
        , ColC
        , ColD
    FROM (
        SELECT ColA
            , ColB
            , MAX(CASE WHEN S = 1 THEN ColCD END) ColC
            , MAX(CASE WHEN S = 2 THEN ColCD END) ColD
        FROM (
            SELECT ColA
                , ColB
                , ColCD
                , ROW_NUMBER() OVER (PARTITION BY N ORDER BY ColCD) S
                , N
            FROM (
                SELECT ROW_NUMBER() OVER (ORDER BY (SELECT NULL)) N
                    , * 
                FROM TestData
                ) t 
                CROSS APPLY (VALUES(ColC),(ColD)) X (ColCD)
            ) A
        GROUP BY N, ColA, ColB
        ) B;
    

    本质上,它对列中的数据进行排序,然后选择不同的行。

    • 0
  3. user353gre3
    2015-01-14T13:31:37+08:002015-01-14T13:31:37+08:00

    我使用了由Aaron Bertrand修改的Jeff Moden split string 函数,并进一步修改它以按排序顺序返回所有列的连接字符串。我将函数与表交叉应用,并使用返回的列值删除所有重复项。以下是我的实现。

    Create function dbo.SortStrings_Moden
    /*Derived from Jeff Moden's Splitter Function
        http://www.sqlservercentral.com/articles/Tally+Table/72993/
    */
    (
       @List NVARCHAR(MAX),
       @Delimiter NVARCHAR(255)
    )
    RETURNS TABLE
    WITH SCHEMABINDING AS
    RETURN
      WITH E1(N)        AS ( SELECT 1 UNION ALL SELECT 1 UNION ALL SELECT 1 UNION ALL 
                             SELECT 1 
                             UNION ALL SELECT 1 UNION ALL SELECT 1 UNION ALL SELECT 1 
                             UNION ALL SELECT 1 UNION ALL SELECT 1 UNION ALL SELECT 1),
           E2(N)        AS (SELECT 1 FROM E1 a, E1 b),
           E4(N)        AS (SELECT 1 FROM E2 a, E2 b),
           E42(N)       AS (SELECT 1 FROM E4 a, E2 b),
           cteTally(N)  AS (
           SELECT 0 UNION ALL SELECT TOP (DATALENGTH(ISNULL(@List,1))) 
                             ROW_NUMBER() OVER (ORDER BY (SELECT NULL)) FROM E42),
           cteStart(N1) AS (SELECT t.N+1 FROM cteTally t
                             WHERE (SUBSTRING(@List,t.N,1) = @Delimiter OR t.N = 0)),
           cteSorted as (SELECT Item = SUBSTRING(@List, s.N1, 
            ISNULL(NULLIF(CHARINDEX(@Delimiter,@List,s.N1),0)-s.N1,8000))
                        From cteStart s)
                Select  substring((
                    Select ','+ Item  AS [text()]
                        From cteSorted ORDER BY Item For XML PATH ('') ), 2, 1000) 
            [SortItem];
    
    -- Create sample table #TestData
    Create table #TestData (ColA int, ColB int, ColC nvarchar(10), ColD nvarchar(10));
    
    -- Populate the table with sample data
    Insert into #TestData
        SELECT 1, 1, 'ABC', 'DEF'
        UNION ALL
        SELECT 1, 1, 'DEF', 'ABC'
        UNION ALL
        SELECT 1, 1, 'GHJ', 'LKJ'
        UNION ALL
        SELECT 1, 1, 'LKJ', 'GHJ'
        UNION ALL
        SELECT 1, 1, 'ABC', 'HJK'
        UNION ALL
        SELECT 1, 1, 'HJK', 'ABC'
        UNION ALL
        SELECT 2, 2, NULL, 'XYZ'
        UNION ALL
        SELECT 2, 2, 'XYZ', NULL;
    
    -- Query to get the results
    With cteRN as(
     Select ColA, ColB, ColC, ColD, ROW_NUMBER() over(partition by SortItem 
      order by ColA, ColB, ColC, ColD) as rn from #TestData
     cross apply dbo.SplitStrings_Moden(
         cast(isnull(ColA, '') as varchar(10)) + ',' + 
         cast(isnull(ColB, '') as varchar(10)) + ',' + 
         isnull(ColC, '') + ',' + isnull(ColD, ''), N','))
    Select ColA, ColB, ColC, ColD from cteRN where rn = 1;
    
    • 0

相关问题

  • SQL Server - 使用聚集索引时如何存储数据页

  • 我需要为每种类型的查询使用单独的索引,还是一个多列索引可以工作?

  • 什么时候应该使用唯一约束而不是唯一索引?

  • 死锁的主要原因是什么,可以预防吗?

  • 如何确定是否需要或需要索引

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    连接到 PostgreSQL 服务器:致命:主机没有 pg_hba.conf 条目

    • 12 个回答
  • Marko Smith

    如何让sqlplus的输出出现在一行中?

    • 3 个回答
  • Marko Smith

    选择具有最大日期或最晚日期的日期

    • 3 个回答
  • Marko Smith

    如何列出 PostgreSQL 中的所有模式?

    • 4 个回答
  • Marko Smith

    列出指定表的所有列

    • 5 个回答
  • Marko Smith

    如何在不修改我自己的 tnsnames.ora 的情况下使用 sqlplus 连接到位于另一台主机上的 Oracle 数据库

    • 4 个回答
  • Marko Smith

    你如何mysqldump特定的表?

    • 4 个回答
  • Marko Smith

    使用 psql 列出数据库权限

    • 10 个回答
  • Marko Smith

    如何从 PostgreSQL 中的选择查询中将值插入表中?

    • 4 个回答
  • Marko Smith

    如何使用 psql 列出所有数据库和表?

    • 7 个回答
  • Martin Hope
    Jin 连接到 PostgreSQL 服务器:致命:主机没有 pg_hba.conf 条目 2014-12-02 02:54:58 +0800 CST
  • Martin Hope
    Stéphane 如何列出 PostgreSQL 中的所有模式? 2013-04-16 11:19:16 +0800 CST
  • Martin Hope
    Mike Walsh 为什么事务日志不断增长或空间不足? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland 列出指定表的所有列 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney MySQL 能否合理地对数十亿行执行查询? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx 如何监控大型 .sql 文件的导入进度? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison 你如何mysqldump特定的表? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 对 SQL 查询进行计时? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas 如何从 PostgreSQL 中的选择查询中将值插入表中? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 列出所有数据库和表? 2011-02-18 00:45:49 +0800 CST

热门标签

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve