AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / server / 问题 / 590230
Accepted
dyasny
dyasny
Asked: 2014-04-21 10:02:06 +0800 CST2014-04-21 10:02:06 +0800 CST 2014-04-21 10:02:06 +0800 CST

最大化 rsync 性能和吞吐量 - 直接连接的千兆服务器

  • 772

我有两台运行 CentOS 6.5 的戴尔 R515 服务器,其中一个 Broadcom NIC 直接连接到另一个。我每天晚上使用 rsync over ssh 使用直接链接将备份从对中的主服务器推送到辅助服务器。监控流量,我看到大约 2MBps 的吞吐量,这比我对千兆端口的预期要低得多。我已经将两边的 MTU 都设置为 9000,但这似乎并没有改变任何东西。

是否有一组推荐的设置和优化可以使我达到最大可用吞吐量?此外,由于我使用 rsync over ssh(或可能只是 NFS)来复制数百万个文件(约 6Tb 的小文件 - 一个巨大的 Zimbra 邮件存储),我正在寻找的优化可能需要更具体地针对我的特定用例.

如果这很重要,我在两边都使用 ext4

谢谢

编辑:我使用了以下rsync选项,结果非常相似:

rsync -rtvu --delete source_folder/ destination_folder/

rsync -avHK --delete --backup --backup-dir=$BACKUPDIR source_folder/ destination_folder/

目前,我在通过cp相同的直接电缆链接使用 NFS 导出时看到相同级别的不良性能。

EDIT2:完成同步后,我可以运行iperf并发现性能约为 990Mbits/sec,缓慢是由于实际使用的数据集。

linux
  • 3 3 个回答
  • 81543 Views

3 个回答

  • Voted
  1. Best Answer
    ewwhite
    2014-04-21T10:17:31+08:002014-04-21T10:17:31+08:00

    文件数量和 SSH 加密开销可能是最大的障碍。您不会在这样的传输中看到线速。

    改进的选项包括:

    • 将 rsync+SSH 与成本较低的加密算法一起使用(例如-e "ssh -c arcfour")
    • 使用类似HPN-SSH的方式完全消除 SSH 传输上的加密。
    • 基于块的传输。快照、ddZFS快照发送/接收等。
    • 如果这是一次性或不频繁的传输,请使用tar、netcat( nc)、mbuffer或某种组合。
    • 检查您的 CentOStuned-adm设置。
    • 从文件系统挂载中删除 atime。检查其他文件系统挂载选项。
    • NIC 发送/接收缓冲区。
    • 调整你的rsync命令。-W整个文件选项在这里有意义吗?是否启用压缩?
    • 针对传输类型(SSD、主轴计数、RAID 控制器缓存)优化您的存储子系统。
    • 26
  2. alxgomz
    2014-04-21T10:27:02+08:002014-04-21T10:27:02+08:00

    您可能知道复制大量小文件(例如使用 MailDir 格式或类似格式的邮箱)绝对不是利用高带宽接口的最佳选择。SSH 可能也不是最好的传输协议。我会尝试使用 tar 在源主机上创建一个压缩包,然后再将其发送给您的辅助主机。

    tar c /var/mail | ssh root@secondary-host 'tar x -C /var/backups'
    

    如果您需要增量备份,您可能需要尝试-gtar 的选项。如果您仍然需要最大化吞吐量,请尝试使用 netcat 而不是 ssh。

    • 4
  3. Scott Leadley
    2014-04-21T19:05:37+08:002014-04-21T19:05:37+08:00

    试着梳理一下促成因素:

    • CPU(例如 /dev/zero 的 dd 通过环回管道传输)
    • 磁盘 I/O(例如,通过管道传输到 cat > /dev/null [管道以防止短路]的大文件的 dd)
    • 物理网络 I/O(例如 dd 通过管道传输到另一台机器)
    • 等等

    并独立测试它们。

    我对 Broadcom 驱动程序有过一些不好的体验,所以我的第一个建议是测试可用的网络带宽: dd if=/dev/zero bs=1m count=10k | rsh backup_host cat \> /dev/null

    • 1

相关问题

  • Linux 主机到主机迁移

  • 如何在 Linux 机器上找到有关硬件的详细信息?

  • 如何在 Linux 下监控每个进程的网络 I/O 使用情况?

  • 在 RHEL4 上修改 CUPS 中的现有打印机设置

  • 为本地网络中的名称解析添加自定义 dns 条目

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    新安装后 postgres 的默认超级用户用户名/密码是什么?

    • 5 个回答
  • Marko Smith

    SFTP 使用什么端口?

    • 6 个回答
  • Marko Smith

    命令行列出 Windows Active Directory 组中的用户?

    • 9 个回答
  • Marko Smith

    什么是 Pem 文件,它与其他 OpenSSL 生成的密钥文件格式有何不同?

    • 3 个回答
  • Marko Smith

    如何确定bash变量是否为空?

    • 15 个回答
  • Martin Hope
    Tom Feiner 如何按大小对 du -h 输出进行排序 2009-02-26 05:42:42 +0800 CST
  • Martin Hope
    Noah Goodrich 什么是 Pem 文件,它与其他 OpenSSL 生成的密钥文件格式有何不同? 2009-05-19 18:24:42 +0800 CST
  • Martin Hope
    Brent 如何确定bash变量是否为空? 2009-05-13 09:54:48 +0800 CST
  • Martin Hope
    cletus 您如何找到在 Windows 中打开文件的进程? 2009-05-01 16:47:16 +0800 CST

热门标签

linux nginx windows networking ubuntu domain-name-system amazon-web-services active-directory apache-2.4 ssh

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve