AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / dba / 问题 / 319716
Accepted
Ross Bush
Ross Bush
Asked: 2022-11-16 06:26:18 +0800 CST2022-11-16 06:26:18 +0800 CST 2022-11-16 06:26:18 +0800 CST

将来自多个数据库的相同表的数据合并到一个更大的表中。N-1表复制

  • 772

多租户、多数据库系统中有N个表结构相同的数据库。希望将这些数据库中的一个或多个表复制到 OLAP 数据库中的一个更大的表中,我假设它可以工作。

-使用事务复制-

  1. 为发布者处的所有表文章重新创建 PK,包括标识数据库的新添加字段。

  2. 将选项“当文章存在时”设置为不删除和使用行过滤器(包括数据库标识符)。

  3. 使用唯一数据库标识符为每个表添加行过滤器。

我的问题是,鉴于上述情况,如果为发布者创建新快照,是否会删除订阅者的陈旧数据,并且只针对该发布者?恐怕这就是删除表和重新创建的目的:/

简单来说,如果我有

表A
数据库ID
表格辅助

如果重新初始化名为 Database007 的发布的新快照。是否会删除 Database007 订阅中的所有数据并为 Database007 重新水化,或者我是否会遇到 PK 违规。

我也一直在研究 CDC,但是,这似乎不支持 N-1 复制方案。另外,请随时抛出任何其他想法。

sql-server
  • 1 1 个回答
  • 28 Views

1 个回答

  • Voted
  1. Best Answer
    AMtwo
    2022-11-16T06:55:25+08:002022-11-16T06:55:25+08:00

    使用视图

    我以前必须解决这个问题,最可靠的方法是复制到不同的表,然后创建一个视图将它们联合在一起。

    • 在复制时,您可以将文章设置为在发布者端使用不同的名称。
      • 您可以将每个位置的表重定向到它自己的模式中。根据您现有的模式使用,您可以复制dbo.Transactions到LocationA.Transactions或LocA_dbo.Transactions。
      • dbo.Transactions您可以使用此功能将文章重命名为dbo.Transactions_LocationA.
      • 作为重命名的替代方法,您可以将每个 Publisher 复制到它自己的数据库中,这完全避免了命名冲突,但可能会引入一些与跨数据库所有权链接相关的权限问题。
    • 创建一个执行UNION ALL所有单独表的视图。
      • 这实际上只是在不使用同名功能的情况下进行分区。
      • 在视图定义中,您可以添加一列,并将源位置列为常量,以标识结果视图中的数据。

    一些谨慎

    在上面的计划中,我建议您确保SELECT *出于所有常见原因避免出现在视图中。如果在不同的时间对不同的发布者进行模式更改,则视图可能会从第一个表的时间开始被破坏并被更改,直到最后一个被更改。取而代之的是,显式列出列并仅在架构更改无处不在时才更新视图。

    在复制到单个表中时,也需要考虑相同的架构更改注意事项。虽然我是那种情况,但它更有可能破坏发送的复制,而不是仅仅破坏视图。

    多对一复制

    Snapshot 代理的工作方式是它本质上只是自动使用 BCP 从发布者导出并导入到订阅者。默认选项是在您重新初始化发布时截断并重新加载。您也可以更改为使用 delete 而不是 truncate,但这将使用单个未批处理的DELETE语句,这可能会导致阻塞和事务日志膨胀。

    如果您的多个发布者有重叠的 PK,那么您需要像您建议的那样将它们统一化。但是,这可能会影响性能——可能会产生巨大的成本。除了将列添加到每个 PK 的大小考虑之外,如果你的 PK 也是你的聚簇索引,那么 uniquifier 也会包含在每个非聚簇索引中。

    您还需要确保将 uniquifier 添加到 PK 定义的末尾,以免破坏现有查询的 SARGability。但是,即使您这样做,您也可能会注意到导致性能下降的查询计划的变化。

    查询优化器知道如果ID是单列 PK,则ID = @id最多返回一行。在优化基于集合的查询和连接期间使用相同的基数规则。因此,您可能会开始看到查询计划发生变化,其中 1:1 连接现在被解释为 1:多连接。这可以通过在“旧”PK 上添加唯一索引来进一步缓解。您甚至可以选择将“旧”PK 保留为唯一聚集索引,并将“新”PK 设为非聚集 PK。

    将来自多个目标的复制添加到单个订阅者表的各种挑战使其成为一个非常具有挑战性的解决方案。它需要对发布者数据库进行重大更改。我不建议使用此选项,除非在绿色领域开发中,在这种情况下可以从一开始就考虑架构和性能。

    此外,不可避免地需要重新快照发布者意味着小心地从订阅者中删除适当的行。将 Partitioning 与每个发布者分区一起使用可以在此处提供帮助,但会引入一组不同的复杂性。恕我直言,伪分区是一种更易于长期管理的解决方案。

    复制到唯一目标可确保发布者不需要重大更改和测试,并减轻单个 1:many 复制目标中涉及的持续支持负担

    • 2

相关问题

  • SQL Server - 使用聚集索引时如何存储数据页

  • 我需要为每种类型的查询使用单独的索引,还是一个多列索引可以工作?

  • 什么时候应该使用唯一约束而不是唯一索引?

  • 死锁的主要原因是什么,可以预防吗?

  • 如何确定是否需要或需要索引

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    连接到 PostgreSQL 服务器:致命:主机没有 pg_hba.conf 条目

    • 12 个回答
  • Marko Smith

    如何让sqlplus的输出出现在一行中?

    • 3 个回答
  • Marko Smith

    选择具有最大日期或最晚日期的日期

    • 3 个回答
  • Marko Smith

    如何列出 PostgreSQL 中的所有模式?

    • 4 个回答
  • Marko Smith

    列出指定表的所有列

    • 5 个回答
  • Marko Smith

    如何在不修改我自己的 tnsnames.ora 的情况下使用 sqlplus 连接到位于另一台主机上的 Oracle 数据库

    • 4 个回答
  • Marko Smith

    你如何mysqldump特定的表?

    • 4 个回答
  • Marko Smith

    使用 psql 列出数据库权限

    • 10 个回答
  • Marko Smith

    如何从 PostgreSQL 中的选择查询中将值插入表中?

    • 4 个回答
  • Marko Smith

    如何使用 psql 列出所有数据库和表?

    • 7 个回答
  • Martin Hope
    Jin 连接到 PostgreSQL 服务器:致命:主机没有 pg_hba.conf 条目 2014-12-02 02:54:58 +0800 CST
  • Martin Hope
    Stéphane 如何列出 PostgreSQL 中的所有模式? 2013-04-16 11:19:16 +0800 CST
  • Martin Hope
    Mike Walsh 为什么事务日志不断增长或空间不足? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland 列出指定表的所有列 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney MySQL 能否合理地对数十亿行执行查询? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx 如何监控大型 .sql 文件的导入进度? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison 你如何mysqldump特定的表? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 对 SQL 查询进行计时? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas 如何从 PostgreSQL 中的选择查询中将值插入表中? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 列出所有数据库和表? 2011-02-18 00:45:49 +0800 CST

热门标签

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve