AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / server / 问题 / 106937
In Process
ScottZ
ScottZ
Asked: 2010-01-28 11:22:16 +0800 CST2010-01-28 11:22:16 +0800 CST 2010-01-28 11:22:16 +0800 CST

Linux Software Raid 10 在 1 个驱动器出现故障后挂起,mdadm 不会让我强制删除有故障的设备

  • 772

我有一个 Linux 软件 RAID 10 设置,包括 5 个 RAID 1(每个镜像设置两个驱动器)和一个跨所有 5 个 RAID 1 对的 RAID 0。为了测试没有一个驱动器在负载下会很快发生故障,我在 RAID 0 上使用了具有破坏性读/写模式的坏块。

坏块命令:坏块 -b 4096 -c 98304 -p 0 -w -s /dev/md13

其中一个设备出现故障,而 badblocks 程序并没有愉快地继续运行,而是挂起。如果我运行同步命令,这也会挂起。首先,我假设这不是 RAID 1 设备的标准行为。如果其中一个驱动器发生故障,它应该仍然能够毫无问题地写入两个驱动器组成的虚拟设备。

所以我继续强制驱动器失败并尝试将其移除。我可以毫无问题地将驱动器设置为故障(但是 IO 操作仍然挂起)。我无法从它说它很忙的 raid 中完全删除该设备。我的假设是,如果我可以将它完全踢出团队,IO 将继续进行,但这只是一个假设,我确实认为我正在处理某种错误。

这里到底发生了什么?由于错误,我是否处于无法恢复的状态?

该系统正在运行内核 2.6.18,因此它并不是全新的,但我认为鉴于软件 raid 已经存在了很长时间,这样的问题不会发生。

非常感谢任何见解。

mdadm --detail /dev/md13

/dev/md13:

    Version : 00.90.03   Creation Time : Thu Jan 21 14:21:57 2010
 Raid Level : raid0
 Array Size : 2441919360 (2328.80 GiB 2500.53 GB)    Raid Devices : 5  

设备总数:5 首选次要设备:13 持久性:超级块是持久性的

Update Time : Thu Jan 21 14:21:57 2010
      State : clean  Active Devices : 5 Working Devices : 5 

故障设备:0 备用设备:0

 Chunk Size : 64K

       UUID : cfabfaee:06cf0cb2:22929c7b:7b037984
     Events : 0.3

Number   Major   Minor   RaidDevice State
   0       9        7        0      active sync   /dev/md7
   1       9        8        1      active sync   /dev/md8
   2       9        9        2      active sync   /dev/md9
   3       9       10        3      active sync   /dev/md10
   4       9       11        4      active sync   /dev/md11

失败的突袭输出:

/dev/md8:版本:00.90.03 创建时间:2010 年 1 月 21 日星期四 14:20:47 RAID 级别:raid1 阵列大小:488383936 (465.76 GiB 500.11 GB) 设备大小:488383936 (465.76 GiB 500.11 GB) Raid 设备:2
设备总数:2 首选次要设备:8 持久性:超级块是持久性的

Update Time : Mon Jan 25 04:52:25 2010
      State : active, degraded  Active Devices : 1 Working Devices : 1

故障设备:1 备用设备:0

       UUID : 2865aefa:ab6358d8:8f82caf4:1663e806
     Events : 0.11

Number   Major   Minor   RaidDevice State
   0      65       17        0      active sync   /dev/sdr1
   1       8      209        1      faulty   /dev/sdn1
linux raid mdadm software-raid raid10
  • 2 2 个回答
  • 1966 Views

2 个回答

  • Voted
  1. twistedbrain
    2010-02-06T11:36:03+08:002010-02-06T11:36:03+08:00

    抱歉,也许我不太了解,并且 cat /proc/mdstat 可能会有所帮助,但据我所知,您在破坏 RAID0 等基础 RAID1 阵列上的数据时开枪打死了自己。如果您必须测试 RAID 可靠性,您必须将驱动器、磁盘标记为故障,而不是破坏引用所有底层 RAID1 磁盘的逻辑块,如果我很好地理解了这个问题(让我知道)。

    • 1
  2. Dom
    2010-01-28T13:32:21+08:002010-01-28T13:32:21+08:00

    也许您需要要求内核删除有故障的驱动器。它将释放挂起的 RAID。

    您可以使用http://bash.cyberciti.biz/diskadmin/rescan-linux-scsi-bus/之类的脚本将其删除

    • 0

相关问题

  • 更改 PHP 的默认配置设置?

  • 保护新的 Ubuntu 服务器 [关闭]

  • (软)Ubuntu 7.10 上的 RAID 6,我应该迁移到 8.10 吗?

  • RAID 控制器通常是否存在 SATA 驱动器品牌兼容性问题?

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    新安装后 postgres 的默认超级用户用户名/密码是什么?

    • 5 个回答
  • Marko Smith

    SFTP 使用什么端口?

    • 6 个回答
  • Marko Smith

    从 IP 地址解析主机名

    • 8 个回答
  • Marko Smith

    如何按大小对 du -h 输出进行排序

    • 30 个回答
  • Marko Smith

    命令行列出 Windows Active Directory 组中的用户?

    • 9 个回答
  • Marko Smith

    什么是 Pem 文件,它与其他 OpenSSL 生成的密钥文件格式有何不同?

    • 3 个回答
  • Marko Smith

    如何确定bash变量是否为空?

    • 15 个回答
  • Martin Hope
    MikeN 在 Nginx 中,如何在维护子域的同时将所有 http 请求重写为 https? 2009-09-22 06:04:43 +0800 CST
  • Martin Hope
    Tom Feiner 如何按大小对 du -h 输出进行排序 2009-02-26 05:42:42 +0800 CST
  • Martin Hope
    0x89 bash中的双方括号和单方括号有什么区别? 2009-08-10 13:11:51 +0800 CST
  • Martin Hope
    Kyle Brandt IPv4 子网如何工作? 2009-08-05 06:05:31 +0800 CST
  • Martin Hope
    Noah Goodrich 什么是 Pem 文件,它与其他 OpenSSL 生成的密钥文件格式有何不同? 2009-05-19 18:24:42 +0800 CST
  • Martin Hope
    Brent 如何确定bash变量是否为空? 2009-05-13 09:54:48 +0800 CST
  • Martin Hope
    cletus 您如何找到在 Windows 中打开文件的进程? 2009-05-01 16:47:16 +0800 CST

热门标签

linux nginx windows networking ubuntu domain-name-system amazon-web-services active-directory apache-2.4 ssh

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve