AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / server / 问题 / 1073871
Accepted
mike
mike
Asked: 2021-08-09 01:26:03 +0800 CST2021-08-09 01:26:03 +0800 CST 2021-08-09 01:26:03 +0800 CST

磁盘问题:irq_stat 0x20000000,主机总线错误

  • 772

将大文件 (50+GB) 从 NVMe 磁盘复制到 SATA 7200rpm HDD 磁盘时,我在完全修补的 Ubuntu 20.04 的日志中看到以下错误:

Aug 08 00:45:59 host kernel: ata6.00: exception Emask 0x20 SAct 0x0 SErr 0x0 action 0x6 frozen
Aug 08 00:45:59 host kernel: ata6.00: irq_stat 0x20000000, host bus error
Aug 08 00:45:59 host kernel: ata6.00: failed command: WRITE DMA EXT
Aug 08 00:45:59 host kernel: ata6.00: cmd 35/00:08:30:a2:e0/00:00:e8:00:00/e0 tag 23 dma 4096 out
                                    res 50/00:00:00:00:00/00:00:00:00:00/00 Emask 0x20 (host bus error)
Aug 08 00:45:59 host kernel: ata6.00: status: { DRDY }
Aug 08 00:45:59 host kernel: ata6: hard resetting link
Aug 08 00:46:00 host kernel: ata6: SATA link up 6.0 Gbps (SStatus 133 SControl 300)
Aug 08 00:46:00 host kernel: ata6.00: configured for UDMA/133
Aug 08 00:46:00 host kernel: ata6: EH complete

ata6.00是正在写入的磁盘。
问题是间歇性的。有时 24 小时不出现,有时每小时出现几次。通常磁盘会恢复,但有时文件系统会损坏,需要卸载、修复(如果可能)并重新安装。

我尝试了什么:

  1. 我尝试了 3 种不同品牌的硬盘。所有人都有同样的问题。
  2. 我怀疑是硬件问题。我更换了主板和 SATA 电缆。这些都没有帮助。
  3. 我有另一台具有相同配置的服务器。该问题不会在那里发生。相同的工作量。
  4. 我还有另一台配置完全不同的服务器(英特尔与 AMD)。问题发生在那里。相同的工作量。
  5. 我通过禁用 NCQ echo 1 > /sys/block/sda/device/queue_depth。没有帮助。

我没有主意了……
这些都是数据中心级组件。鉴于我采取的步骤,我想这不是硬件制造缺陷。
这可能与软件/操作系统/BIOS 相关吗?
任何想法我还应该尝试什么?

hard-drive ubuntu sata drive-failure
  • 2 2 个回答
  • 205 Views

2 个回答

  • Voted
  1. Matthew Ife
    2021-08-25T02:53:41+08:002021-08-25T02:53:41+08:00

    也许这更多的是工作温度的问题?随着磁盘不断使用,它的物理位置和热得失比变得太高导致行为不稳定?

    在像您这样的较新内核上,可以将驱动器温度放入 sysfs 中的以下路径:

    /sys/class/hwmon/*
    

    一定要确保drivetemp模块加载了modprobe drivetemp.

    您可以考虑监视此处的文件并再次开始大文件副本,此处的内核文档提供了如何解释这些文件的指示。

    它们包括有用的值,例如工作最低/最高温度,一些驱动程序还可以提供警报指示器,这是在故障时触发的与芯片相关的警报。

    • 1
  2. Best Answer
    mike
    2021-08-29T23:32:06+08:002021-08-29T23:32:06+08:00

    似乎可以通过升级到 Ubuntu 21.04 来解决。不知道为什么。服务器现在运行稳定,没有任何 ATA 问题。

    • 0

相关问题

  • 总大小(磁盘)与总大小(媒体)

  • Linux:“发现重复的 PV XXXXYYYYY:用户 /dev/sdb1 而不是 /dev/sda1”

  • Windows C:驱动器大小

  • 了解磁盘队列长度

  • md5sum 重复为同一台机器上的同一文件提供不同的校验和

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    新安装后 postgres 的默认超级用户用户名/密码是什么?

    • 5 个回答
  • Marko Smith

    SFTP 使用什么端口?

    • 6 个回答
  • Marko Smith

    命令行列出 Windows Active Directory 组中的用户?

    • 9 个回答
  • Marko Smith

    什么是 Pem 文件,它与其他 OpenSSL 生成的密钥文件格式有何不同?

    • 3 个回答
  • Marko Smith

    如何确定bash变量是否为空?

    • 15 个回答
  • Martin Hope
    Tom Feiner 如何按大小对 du -h 输出进行排序 2009-02-26 05:42:42 +0800 CST
  • Martin Hope
    Noah Goodrich 什么是 Pem 文件,它与其他 OpenSSL 生成的密钥文件格式有何不同? 2009-05-19 18:24:42 +0800 CST
  • Martin Hope
    Brent 如何确定bash变量是否为空? 2009-05-13 09:54:48 +0800 CST
  • Martin Hope
    cletus 您如何找到在 Windows 中打开文件的进程? 2009-05-01 16:47:16 +0800 CST

热门标签

linux nginx windows networking ubuntu domain-name-system amazon-web-services active-directory apache-2.4 ssh

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve