关于【redundancy】的问题- 第1页

lion

Asked: 2021-06-01 03:12:30 +0800 CST

VLAN - 具有相同第二个交换机的网络冗余？

1

是否可以在两个不同的交换机上设置相同的 VLAN，IP 相同，但服务器的双端口网卡上的 MAC 不同？如果交换机 1 出现故障或需要维护，我希望交换机 2 接管服务器之间的通信，反之亦然，因为我不希望整个服务器网络彼此之间没有连接，因为它们要么是彼此的副本，要么接收旧数据的分片，我需要使网络高度可用 - 冗余。我的网络的整个目的是 3 个分片，每个分片有 3 个副本，并且分布相同应用程序数据的分片以使其故障安全，但是在我的工程计划中，网络还不能通过 1 个交换机进行故障安全。

像这样的东西：

分片 I - 新数据复制，新传入数据 - 3 台服务器，使其在服务器级别 server1 + server2 + server3 上故障安全

Shard II - server4（访问较少的数据） - 定期从新数据中移动数据 Shard I - 不需要副本（RAID 级别的冗余）

Shard III - 相同的 server4，但连接到 server4 的模块化存储阵列上的数据 - 数据定期从 Shard II 移动到这里（访问最少的数据） - 不需要副本（RAID 级别的冗余）

所以我需要使网络故障安全。我的想法是第二个相同的开关，但对设置有疑问。还在研究如何实现。假设两个交换机都没有连接的最佳方法是什么？如果每台服务器同时从其网卡上的不同端口连接到两台交换机，它会起作用吗？使用开关，如果重要的话 - 广达 LB6M。有什么更好的开关可以推荐给用例吗？交换机需要相互连接吗？然后我可以尝试使用 Dell EMC PowerSwitch S4048-ON 48 10GbE SFP+、6 40Gbps QSFP+ 并使用 40GbE QSFP+ 互连交换机和 10Gbe SFP+ 将服务器连接到交换机。谢谢！

Jesse the Wind Wanderer

Asked: 2020-08-05 19:04:58 +0800 CST

将大型驱动器镜像到两个较小驱动器的最佳方法

0

我有一个 8.0 TB 的驱动器，很快就会充满视频
我有两个备用 4.0 TB 驱动器
该系统正在运行Linux Mint 19 Tara并且是我的桌面系统（是的，它是一个能够支持总共 6 个 HDD 的大系统）

如果驱动器发生故障，使用这三个驱动器创建冗余的最佳方法是什么？

我的想法到目前为止：

选项 1：仅使用 8.0 GB 驱动器的一半，并在三个 4.0 TB 卷之间设置 Raid 5。

优点：简单而成熟的冗余，可能通过条带化带来性能优势。
缺点：如果任何驱动器出现故障，则需要干预以恢复数据访问（我之前没有使用过 Raid，并且可能在需要之前不会再次使用它，因此我需要一天时间来刷新如何在驱动器出现故障后恢复阵列）。它还使 8.0 GB 驱动器的一半成为冗余。

选项 2：将两个 4.0 TB 驱动器合并为一个 8.0 TB 卷并将 8.0 TB 驱动器镜像到它上面。

优点：简单和透明的冗余。活动数据位于发生故障的驱动器上的可能性较小。（如果镜像中的两个驱动器中的任何一个出现故障，我将更换它并重新创建镜像，如果 8.0 TB 驱动器出现故障，我将购买另一个并从镜像中恢复。）
缺点：如果不增加复杂层，可能无法做到这一点？

我的主要问题是：选项 2 是否可能，如果可能，如何？

您的建议也值得赞赏。:-)

Josh

Asked: 2020-06-27 11:05:07 +0800 CST

负载均衡器的 DNS 和容错策略

1

我试图让自己了解如何为应用程序服务器构建一个高度可用的负载平衡服务，例如 HTTP 流量，以及它们如何与 DNS 服务器一起工作。

考虑下图。我的理解是，负载均衡器（例如 HAProxy）可以配置为指定一个主服务器和一个备用策略，如果主服务器发生故障，则备用服务器（成为新的主服务器）。

那不需要DNS服务器知道或选择主LB服务器吗？
DNS 服务器有时不是在管理负载均衡器的公司或组织的数据中心之外（或直接控制之外）吗？如果是这样，他们如何在 DNS 服务器中指定要访问的 LB 服务器？

Brian Thomas

Asked: 2020-01-23 15:42:12 +0800 CST

zfs raidz-2 如何从 3 个驱动器故障中恢复？

2

我想知道发生了什么，ZFS 是如何完全恢复的，或者我的数据是否仍然完好无损。
当我昨晚进来时，我感到沮丧，然后感到困惑。

zpool status
  pool: san
 state: DEGRADED
status: One or more devices has experienced an unrecoverable error.  An
        attempt was made to correct the error.  Applications are unaffected.
action: Determine if the device needs to be replaced, and clear the errors
        using 'zpool clear' or replace the device with 'zpool replace'.
   see: http://zfsonlinux.org/msg/ZFS-8000-9P
  scan: resilvered 392K in 0h0m with 0 errors on Tue Jan 21 16:36:41 2020
config:

        NAME                                          STATE     READ WRITE CKSUM
        san                                           DEGRADED     0     0     0
          raidz2-0                                    DEGRADED     0     0     0
            ata-WDC_WD20EZRX-00DC0B0_WD-WMC1T3458346  ONLINE       0     0     0
            ata-ST2000DM001-9YN164_W1E07E0G           DEGRADED     0     0    38  too many errors
            ata-WDC_WD20EZRX-19D8PB0_WD-WCC4M0428332  DEGRADED     0     0    63  too many errors
            ata-ST2000NM0011_Z1P07NVZ                 ONLINE       0     0     0
            ata-WDC_WD20EARX-00PASB0_WD-WCAZAJ490344  ONLINE       0     0     0
            wwn-0x50014ee20949b6f9                    DEGRADED     0     0    75  too many errors

errors: No known data errors

怎么可能没有数据错误，并且整个池都没有故障？

一个驱动器sdf对 SMART 的 smartctl 测试失败read fail，其他驱动器的问题稍小；不可纠正/未决扇区或 UDMA CRC 错误。

我尝试将每个发生故障的驱动器切换到离线状态，然后一次切换到一个在线状态，但这没有帮助。

    $ zpool status
  pool: san
 state: DEGRADED
status: One or more devices has experienced an unrecoverable error.  An
        attempt was made to correct the error.  Applications are unaffected.
action: Determine if the device needs to be replaced, and clear the errors
        using 'zpool clear' or replace the device with 'zpool replace'.
   see: http://zfsonlinux.org/msg/ZFS-8000-9P
  scan: resilvered 392K in 0h0m with 0 errors on Tue Jan 21 16:36:41 2020
config:

        NAME                                          STATE     READ WRITE CKSUM
        san                                           DEGRADED     0     0     0
          raidz2-0                                    DEGRADED     0     0     0
            ata-WDC_WD20EZRX-00DC0B0_WD-WMC1T3458346  ONLINE       0     0     0
            ata-ST2000DM001-9YN164_W1E07E0G           DEGRADED     0     0    38  too many errors
            ata-WDC_WD20EZRX-19D8PB0_WD-WCC4M0428332  OFFLINE      0     0    63
            ata-ST2000NM0011_Z1P07NVZ                 ONLINE       0     0     0
            ata-WDC_WD20EARX-00PASB0_WD-WCAZAJ490344  ONLINE       0     0     0
            wwn-0x50014ee20949b6f9                    DEGRADED     0     0    75  too many errors

因此，如果我的数据实际上仍然全部存在，我感到非常幸运，或者有点困惑，在检查了最差的驱动器之后，我用我唯一的备用驱动器进行了更换。

    $ zpool status
  pool: san
 state: DEGRADED
status: One or more devices is currently being resilvered.  The pool will
        continue to function, possibly in a degraded state.
action: Wait for the resilver to complete.
  scan: resilver in progress since Tue Jan 21 17:33:15 2020
        467G scanned out of 8.91T at 174M/s, 14h10m to go
        77.6G resilvered, 5.12% done
config:

        NAME                                              STATE     READ WRITE CKSUM
        san                                               DEGRADED     0     0     0
          raidz2-0                                        DEGRADED     0     0     0
            ata-WDC_WD20EZRX-00DC0B0_WD-WMC1T3458346      ONLINE       0     0     0
            replacing-1                                   DEGRADED     0     0     0
              ata-ST2000DM001-9YN164_W1E07E0G             OFFLINE      0     0    38
              ata-WDC_WD2000FYYZ-01UL1B1_WD-WCC1P1171516  ONLINE       0     0     0  (resilvering)
            ata-WDC_WD20EZRX-19D8PB0_WD-WCC4M0428332      DEGRADED     0     0    63  too many errors
            ata-ST2000NM0011_Z1P07NVZ                     ONLINE       0     0     0
            ata-WDC_WD20EARX-00PASB0_WD-WCAZAJ490344      ONLINE       0     0     0
            wwn-0x50014ee20949b6f9                        DEGRADED     0     0    75  too many errors

resilver 确实成功完成。

$ zpool status
  pool: san
 state: DEGRADED
status: One or more devices has experienced an unrecoverable error.  An
        attempt was made to correct the error.  Applications are unaffected.
action: Determine if the device needs to be replaced, and clear the errors
        using 'zpool clear' or replace the device with 'zpool replace'.
   see: http://zfsonlinux.org/msg/ZFS-8000-9P
  scan: resilvered 1.48T in 12h5m with 0 errors on Wed Jan 22 05:38:48 2020
config:

        NAME                                            STATE     READ WRITE CKSUM
        san                                             DEGRADED     0     0     0
          raidz2-0                                      DEGRADED     0     0     0
            ata-WDC_WD20EZRX-00DC0B0_WD-WMC1T3458346    ONLINE       0     0     0
            ata-WDC_WD2000FYYZ-01UL1B1_WD-WCC1P1171516  ONLINE       0     0     0
            ata-WDC_WD20EZRX-19D8PB0_WD-WCC4M0428332    DEGRADED     0     0    63  too many errors
            ata-ST2000NM0011_Z1P07NVZ                   ONLINE       0     0     0
            ata-WDC_WD20EARX-00PASB0_WD-WCAZAJ490344    ONLINE       0     0     0
            wwn-0x50014ee20949b6f9                      DEGRADED     0     0    75  too many errors

我现在正处于十字路口。我通常dd将故障驱动器的前 2MB 归零，然后用它自己替换，我可以这样做，但是如果确实有数据丢失，我可能需要最后两个卷来恢复。

我现在桌子上有这个sdf，已删除。我觉得我可以，在最坏的情况下，用这个来帮助恢复。

同时，我想我现在要对降级驱动器的前几 MB 进行开发/归零，并自行更换，我认为事情应该会解决，冲洗并重复第二个故障驱动器，直到我能得到一些替换手上。

问题发生了什么，池如何能够挂起，或者我可能丢失了一些数据（考虑到 zfs 及其报告的完整性，值得怀疑）

可能是由于幸运的失败顺序，例如失败的堆栈的顶部驱动器？

问题这只是仅供参考，与主题无关。是什么导致所有 3 个同时失败？我认为这是一种磨砂膏，它是催化剂。我前一天晚上检查了所有驱动器都在线。

请注意，最近布线一直是个问题，办公室晚上很冷，但这些问题只是drive unavailable，而不是校验和错误。我认为那不是布线，而是老化的驱动器，它们已经 5 年了。但是一天3次失败？来吧，这足以吓到我们很多人！

python152

Asked: 2016-10-05 13:34:54 +0800 CST

通过对不同大小的磁盘进行分区来提高可靠性？

8

我了解 ZFS 更喜欢所有磁盘都具有相同的大小。但是，如果我有两个不同大小的磁盘（1TB 和 1.5TB），我希望有一定的冗余，而不是镜像。所以我将两个磁盘分成 5 个分区，每个分区大约 500GB 并创建一个“raidz”池……zfs 很高兴地答应了。它的设置是否真的增加了任何可靠性？想法是，如果磁盘没有完全损坏，并且只有一部分发生故障，我仍然可以访问数据吗？

Mephy

Asked: 2016-09-27 23:37:50 +0800 CST

故障转移集群中是否可以有多个存储服务器？

-2

我熟悉设置 RAID 阵列，并且在我的家庭环境中运行了一些。

我想知道是否可以在故障转移配置中拥有多个存储服务器。

我希望以此实现的是与这些服务器有一定的冗余。当一台服务器出现故障时，可以完全更换它而不会丢失数据。我的意思不仅仅是磁盘故障，而是更严重的事情。可能是 BIOS 损坏。我以前吃过那些……不漂亮。

实现这一目标的最佳方法是什么，我将如何设置它？

SJ Johnson

Asked: 2016-09-27 09:53:24 +0800 CST

服务器网络冗余和可用性

1

如果我有一台具有 RAID 50 或 10 的服务器，那么数据将分布在硬盘驱动器之间，以防其中一个出现故障。

是否可以跨多个服务器执行相同的操作。可以将数据分布在多台服务器之间，这样即使一台服务器出现故障，数据也不会丢失。我会假设我需要至少 3 台服务器？

我是新手，所以你能给我的任何方向都将不胜感激。

运行 Windows Server 2012。

Sarke

Asked: 2016-05-27 23:47:40 +0800 CST

如何在 DigitalOcean 上的 Kubernetes（或类似）上安全地存储数据和 DB

1

它归结为在 Digital Oceans 之类的东西上设置私有云，而不是 GCE 或 AWS 等其他托管解决方案。后者具有冗余数据存储，可以安全地用作卷，而前者提供更大的每个实例存储。

那么问题来了，如何在像 DigitalOcean 这样的主机上建立一个冗余的分布式存储系统？

有什么东西可以与 K8s 并驾齐驱，或者以类似的方式工作吗？还是必须使用 GlusterFS 之类的东西，然后将其绑定到 K8s？

这样的解决方案与谷歌和亚马逊提供的相比如何？

额外的问题：这些类型的讨论有哪些好的论坛？

Mindaugas Bernatavičius

Asked: 2016-05-19 08:32:52 +0800 CST

用于域名的备份 DNS 服务器 - 最佳配置和故障排除

-1

假设我们有 1 个域的这些名称服务器。

ns.1.com
ns.2.com
ns.3.com
ns.4.com
backup-ns.1.com
backup-ns.2.com

我怎么知道哪个 NS 响应了这个特定的查询，例如使用 dig？考虑到 DNS 缓存。
在正常的 NS 查询中，它们将如何解决？是循环赛吗？

列出 NS 服务器的最佳方式是什么，例如：

ns.1.com
backup-ns.1.com
ns.2.com
backup-ns.2.com
ns.3.com
ns.4.com

cathode

Asked: 2014-07-31 14:34:35 +0800 CST

用自己的 UPS 保护两个机架电源是否有任何价值？

15

我做了一些寻找，并没有找到这个问题的令人满意的答案。

何时需要或建议使用独立的 UPS（在其自己的电源分支电路上）为每个机架供电？详细说明; 当使用带有冗余电源的服务器时，通常建议每个“1”电源连接到分支电路“A”，每个“2”电源由分支电路“B”供电，但是您是否需要两个 UPS 'A' 和 'B' 供稿，还是只有一个？

背景：我的任务是计划对我们内部使用的服务器进行基础架构升级。我们是一家制造公司，我们的大部分设备和定制软件都依赖于在我们的办公室本地拥有可靠的在线服务器。我们目前有两个服务器机房，每个机房都有一个机架，位于大型建筑物的两端（用于防止火灾或事故等的冗余）。他们每个人都有一个从电路“A”供电的 UPS，我们拥有的具有多个 PSU 的设备都连接到了这个 UPS。因此，如果 UPS 要死了……扑通一声，服务器就去了。

我个人的理论是，将每台服务器的 PSU1 连接到 UPS，将每台服务器的 PSU2 连接到直接由电源供电的 PDU，这样可以提供可靠性和成本的良好组合。但我的主管认为我们应该运行两台 UPS 设备，每个供电一台。

如果这个问题太模糊，请告诉我，我会尝试修改它。

VLAN - 具有相同第二个交换机的网络冗余？

将大型驱动器镜像到两个较小驱动器的最佳方法

选项 1：仅使用 8.0 GB 驱动器的一半，并在三个 4.0 TB 卷之间设置 Raid 5。

选项 2：将两个 4.0 TB 驱动器合并为一个 8.0 TB 卷并将 8.0 TB 驱动器镜像到它上面。

我的主要问题是：选项 2 是否可能，如果可能，如何？

负载均衡器的 DNS 和容错策略

zfs raidz-2 如何从 3 个驱动器故障中恢复？

通过对不同大小的磁盘进行分区来提高可靠性？

故障转移集群中是否可以有多个存储服务器？

服务器网络冗余和可用性

如何在 DigitalOcean 上的 Kubernetes（或类似）上安全地存储数据和 DB

用于域名的备份 DNS 服务器 - 最佳配置和故障排除

用自己的 UPS 保护两个机架电源是否有任何价值？

新安装后 postgres 的默认超级用户用户名/密码是什么？

SFTP 使用什么端口？

命令行列出 Windows Active Directory 组中的用户？

什么是 Pem 文件，它与其他 OpenSSL 生成的密钥文件格式有何不同？

如何确定bash变量是否为空？

问题[redundancy](server)

选项 1：仅使用 8.0 GB 驱动器的一半，并在三个 4.0 TB 卷之间设置 Raid 5。

选项 2：将两个 4.0 TB 驱动器合并为一个 8.0 TB 卷并将 8.0 TB 驱动器镜像到它上面。

我的主要问题是：选项 2 是否可能，如果可能，如何？