AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / dba / 问题 / 118474
Accepted
MHSQLDBA
MHSQLDBA
Asked: 2015-10-20 06:52:54 +0800 CST2015-10-20 06:52:54 +0800 CST 2015-10-20 06:52:54 +0800 CST

在 P2P 复制中删除不再需要的历史分区

  • 772

我工作的公司在不同的服务器上有一组数据库(最大的刚好低于 1Tb)——2 个在美国,2 个在欧洲。

我们在 4 个节点之间为每个数据库运行完整的对等复制 - 因此它们都可以进行事务(插入/更新/删除)并且都拥有其他节点收集的数据(在可变延迟内 - 最差连接开启平均约 30-40 秒)。

最大的数据库包含从 2008 年初到今天的数据。所有这些数据都进一步复制到保存所有数据的报告节点。

我需要删除事务节点上的数据,直到 2013 年,以消除事务节点上的驱动器空间不足,因此历史数据将仅在报告节点上可用。

做这个的最好方式是什么?数据相对易于管理,因为它被很好地分区(每月 - 按分区,然后每年分成单独的文件/文件组)。然而,当分区参与复制和读取分区切换时,存在无法删除分区的问题——这也是不允许的。(切换分区先决条件- 第 18 点)

作为一个完整的生产环境,我试图避免任何会影响复制的事情——包括重新同步(大量数据要重新同步,远距离)。

有没有人对如何执行此任务有任何好的建议?

sql-server sql-server-2008-r2
  • 1 1 个回答
  • 86 Views

1 个回答

  • Voted
  1. Best Answer
    MHSQLDBA
    2016-02-25T05:05:16+08:002016-02-25T05:05:16+08:00

    所以,这里没有答案,但经过一定数量的讨论和思考,我在几个月前提出了一个计划。

    我将使这个论坛的答案简明扼要(你可能不同意我有!),试图帮助将来需要执行类似任务的任何人,如果我遗漏任何内容,请随时提问 - 虽然方法是直截了当的。

    因此,主要关注的是删除数据而不会对我们正在复制到/从中复制的节点的生产流量产生重大影响。最简单的方法是隔离您要处理的节点,从该节点中删除数据,同时不影响所有其他节点(包括报告节点)。

    最好的方法(记住你不能删除分区,任何/大多数操作都会被复制,因此会产生大量的流量和大量的行更改),是创建一个新的 SP 并围绕这个设置一个 Publication SP。因此它应该在所有节点上可用。重要的一点是将复制设置为复制 SP 的执行 - 而不是结果(即复制 EXEC Sp_delete 调用而不是删除 WHERE ID = 1,删除 WHERE ID = 2 - 行级别更改)。这是在右键单击您的新出版物(在设置拓扑中的其他节点之前)>属性>文章>单击您设置的 SP_Delete >文章属性按钮>设置突出显示的存储过程文章的属性>复制行=执行存储过程。完成您的 P2P 拓扑。

    但是 MHSQLDBA,您可能会说,这只是通过 SP 分别删除每个节点上的行。- 这就是将 SP 设置为仅进行删除的原因:

    IF @@SERVERNAME='你要影响的当前服务器'

    按照您的删除程序进行操作。

    因此,当在您不想执行删除的服务器上接收到此 EXEC 调用时,它将被忽略,因为@@Servername 不等于您选择的服务器。

    您可能会想——为什么不只在您感兴趣的服务器上创建一个 SP 并运行它呢?- 这是因为如果您这样做,复制会将更改分解为它们如何影响文章(表)行并复制实际更改 - 您必须复制 SP,以便您可以指定复制 SP 的 EXEC而不是由此产生的变化。

    这是我认为/经验中建议的事件顺序:

    1. 使用删除代码创建 SP,指定它仅在 @@SERVERNAME = 您所需的服务器时运行删除代码
    2. 设置一个新的发布,使用 Replicate = Execution of Stored Procedure 在 Article Properties 中复制此 1 SP
    3. 在您想要的服务器上运行 SP,并庆幸您没有用数千个复制的 DELETE 命令搞垮整个产业

    注意事项:

    1. 这仍然是一项艰巨的任务。通过使用此方法,您已经减少了对除您正在使用的服务器之外的所有服务器的影响。你并没有减少你的工作量,事实上你让事情变得更糟 - 你将不得不在每个节点上运行相同的 SP(将 IF 行更改为你的目标服务器),有效地增加了你的工作量做,由你必须影响的服务器数量。但是它非常安全,因为您对所有其他节点的影响很小(我假设您已经使远离您正在处理的节点的流量失败!)
    2. 通过使用此方法,您在节点之间造成了不一致——您确实需要确保要删除的数据不会更改,然后才能在所有需要工作的节点上完成相同的操作。如果您在 1 个节点删除的行在 Estate 的其余部分发生更改,您将以一致性错误告终。
    3. 您可能会将正常复制预期的 SLA 落后于在您正在处理的节点上执行删除所需的时间(我强烈建议您阅读批处理删除) - 因此您需要注意一旦操作完成,在删除操作的锁释放后正常复制恢复正常之前,您不会让节点恢复运行。如果您正在通过高延迟线路进行复制,我强烈建议您使用 PULL 代理而不是 PUSH 检查 - 它会产生巨大的差异。

    可能有一种比使用删除更好的方法将数据从 SP 中移走 - 可能将其移动到另一个不涉及复制的表,然后删除“新”表 - 或者相反,如果你想保留数据小于要删除的数量,将要保留的数据移动到新表,删除旧表,然后重命名新表 - 从这些角度来看有很多建议 - 我在一个更容易的环境中工作争取删除而不是推广一些人员不会理解的概念,所以我正在描述痛苦但基本的方式。

    免责声明:以上所有都是危险的。如果在没有适当的深思熟虑的情况下仓促完成,您可能会严重破坏复制拓扑、您公司的数据甚至您的工作。请采取上述方法并制定自己的作战计划——创建一个测试环境来证明概念、测试测试和重新测试,不要草率地完成这项任务。经过充分的考虑,你会完成你的任务——但在周五下午喝了几杯午餐啤酒后,这样做是不值得的。做对,做一次(尽可能多地进行真实测试),正确地做。

    我希望这可以帮助别人。- 我添加了这一点,因为如果我想要这个答案,我会搜索它:

    从对等复制拓扑中删除大量数据

    • 2

相关问题

  • SQL Server - 使用聚集索引时如何存储数据页

  • 我需要为每种类型的查询使用单独的索引,还是一个多列索引可以工作?

  • 什么时候应该使用唯一约束而不是唯一索引?

  • 死锁的主要原因是什么,可以预防吗?

  • 如何确定是否需要或需要索引

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    连接到 PostgreSQL 服务器:致命:主机没有 pg_hba.conf 条目

    • 12 个回答
  • Marko Smith

    如何让sqlplus的输出出现在一行中?

    • 3 个回答
  • Marko Smith

    选择具有最大日期或最晚日期的日期

    • 3 个回答
  • Marko Smith

    如何列出 PostgreSQL 中的所有模式?

    • 4 个回答
  • Marko Smith

    列出指定表的所有列

    • 5 个回答
  • Marko Smith

    如何在不修改我自己的 tnsnames.ora 的情况下使用 sqlplus 连接到位于另一台主机上的 Oracle 数据库

    • 4 个回答
  • Marko Smith

    你如何mysqldump特定的表?

    • 4 个回答
  • Marko Smith

    使用 psql 列出数据库权限

    • 10 个回答
  • Marko Smith

    如何从 PostgreSQL 中的选择查询中将值插入表中?

    • 4 个回答
  • Marko Smith

    如何使用 psql 列出所有数据库和表?

    • 7 个回答
  • Martin Hope
    Jin 连接到 PostgreSQL 服务器:致命:主机没有 pg_hba.conf 条目 2014-12-02 02:54:58 +0800 CST
  • Martin Hope
    Stéphane 如何列出 PostgreSQL 中的所有模式? 2013-04-16 11:19:16 +0800 CST
  • Martin Hope
    Mike Walsh 为什么事务日志不断增长或空间不足? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland 列出指定表的所有列 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney MySQL 能否合理地对数十亿行执行查询? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx 如何监控大型 .sql 文件的导入进度? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison 你如何mysqldump特定的表? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 对 SQL 查询进行计时? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas 如何从 PostgreSQL 中的选择查询中将值插入表中? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 列出所有数据库和表? 2011-02-18 00:45:49 +0800 CST

热门标签

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve