AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / dba / 问题 / 94520
Accepted
Danielle Paquette-Harvey
Danielle Paquette-Harvey
Asked: 2015-03-06 10:57:24 +0800 CST2015-03-06 10:57:24 +0800 CST 2015-03-06 10:57:24 +0800 CST

在许多数据库之间比较整个表的值的最佳方法是什么?

  • 772

我们正在尝试在许多数据库之间比较整个表的值。用户可以输入表名和列名,以及他想要比较的数据库名。

他们可以输入任意数量的数据库、表格和列。我们想比较每行的行数,只针对指定的列。

ex:
DatabaseA, DatabaseB, DatabaseC
Table1, Col1|Col2|Col3|Col4
Table2, Col1|Col4|Col5|Col6|Col20
...

例如,如果我有:

DatabaseA
Table1, Col1|Col2|Col3|Col4 = 'Apple', 1, 10, 'ABC'

DatabaseB
Table1, Col1|Col2|Col3|Col4 = 'Banana', 1, 10, 'ABC'

有区别。

起初,如果每个表(不包括用户未指定的列),我正在考虑在每行上使用 CHECKSUM 并比较 CHECKSUM,但我读过它并不总是唯一的。

现在我正在考虑使用 HASHBYTES 代替。通过这样做:

    SELECT HASHBYTES('sha2_512', CONVERT(NVARCHAR(MAX), ISNULL(col1,'')) +
           HASHBYTES('sha2_512', CONVERT(NVARCHAR(MAX), ISNULL(col2,'')) +
           HASHBYTES('sha2_512', CONVERT(NVARCHAR(MAX), ISNULL(col3,'')) +
           HASHBYTES('sha2_512', CONVERT(NVARCHAR(MAX), ISNULL(col4,'')) +
    FROM Table1

或者通过这样做:

   With Vals AS 
   (
       SELECT CONVERT(NVARCHAR(MAX), ISNULL(col1, '')) + 
              CONVERT(NVARCHAR(MAX), ISNULL(col2, '')) + 
              CONVERT(NVARCHAR(MAX), ISNULL(col3, '')) + 
              CONVERT(NVARCHAR(MAX), ISNULL(col4, ''))  AS Val
       FROM Table1
   )
   SELECT HASHBYTES ('sha2_512', Val) FROM Vals

你怎么看?你会怎么做?最好的方法是什么?

谢谢

sql-server sql-server-2012
  • 2 2 个回答
  • 3747 Views

2 个回答

  • Voted
  1. Adam
    2015-03-06T16:42:58+08:002015-03-06T16:42:58+08:00

    这可能不是您想要做的,但您可以使用 EXCEPT 语句来获取不同的行:

    SELECT Column1, Column2 FROM DatabaseName1.dbo.TableName1
    EXCEPT
    SELECT Column1, Column2 FROM DatabaseName2.dbo.TableName2
    

    但是,如果您这样做,请确保您也执行相反的操作,除非您知道其他数据库表中不存在的行:

    SELECT Column1, Column2 FROM DatabaseName2.dbo.TableName2
    EXCEPT
    SELECT Column1, Column2 FROM DatabaseName1.dbo.TableName1
    

    希望对您有所帮助。

    • 3
  2. Best Answer
    Danielle Paquette-Harvey
    2015-03-07T06:16:45+08:002015-03-07T06:16:45+08:00

    最后,我们决定最好的方法是使用校验和。原因是:我们想比较指定列的每行行数(您可以指定校验和)。

    起初我们想使用哈希字节,但正如 Mikael 告诉我的那样,它有 8000 字节的限制,这真的太小了。

    尽管亚当的解决方案是一个很好的解决方案,但它并不是我们想要做的。

    所以我们的解决方案是:

    With CheckTables AS 
    (
    SELECT 'Database1' as Name, 'Table1' as TableName, checksum( col1, col2, col3, col4) as chk, col1, col2, col3, col4 FROM Database1.dbo.Table1
    UNION       all
    SELECT 'Database2' as Name, 'Table2' as TableName, checksum( col1, col2, col3, col4) as chk, col1, col2, col3, col4 FROM Database2.dbo.Table1
    -- All of the databases/tables/cols here
    ),
    SameCheckSum AS
    (
    select Name, TableName, count(chk) over (partition by tablename, chk) as SameTableChck, col1, col2, col3, col4
    from CheckTables
    group by Name,tablename, chk,  col1, col2, col3, col4
    )
    SELECT *
    FROM SameCheckSum
    where SameTableChck = 1
    
    • 2

相关问题

  • SQL Server - 使用聚集索引时如何存储数据页

  • 我需要为每种类型的查询使用单独的索引,还是一个多列索引可以工作?

  • 什么时候应该使用唯一约束而不是唯一索引?

  • 死锁的主要原因是什么,可以预防吗?

  • 如何确定是否需要或需要索引

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    连接到 PostgreSQL 服务器:致命:主机没有 pg_hba.conf 条目

    • 12 个回答
  • Marko Smith

    如何让sqlplus的输出出现在一行中?

    • 3 个回答
  • Marko Smith

    选择具有最大日期或最晚日期的日期

    • 3 个回答
  • Marko Smith

    如何列出 PostgreSQL 中的所有模式?

    • 4 个回答
  • Marko Smith

    列出指定表的所有列

    • 5 个回答
  • Marko Smith

    如何在不修改我自己的 tnsnames.ora 的情况下使用 sqlplus 连接到位于另一台主机上的 Oracle 数据库

    • 4 个回答
  • Marko Smith

    你如何mysqldump特定的表?

    • 4 个回答
  • Marko Smith

    使用 psql 列出数据库权限

    • 10 个回答
  • Marko Smith

    如何从 PostgreSQL 中的选择查询中将值插入表中?

    • 4 个回答
  • Marko Smith

    如何使用 psql 列出所有数据库和表?

    • 7 个回答
  • Martin Hope
    Jin 连接到 PostgreSQL 服务器:致命:主机没有 pg_hba.conf 条目 2014-12-02 02:54:58 +0800 CST
  • Martin Hope
    Stéphane 如何列出 PostgreSQL 中的所有模式? 2013-04-16 11:19:16 +0800 CST
  • Martin Hope
    Mike Walsh 为什么事务日志不断增长或空间不足? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland 列出指定表的所有列 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney MySQL 能否合理地对数十亿行执行查询? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx 如何监控大型 .sql 文件的导入进度? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison 你如何mysqldump特定的表? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 对 SQL 查询进行计时? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas 如何从 PostgreSQL 中的选择查询中将值插入表中? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 列出所有数据库和表? 2011-02-18 00:45:49 +0800 CST

热门标签

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve