环境:Linux TRANQUILITY 5.3.18-150300.59.49-preempt #1 SMP PREEMPT Mon Feb 7 14:40:20 UTC 2022 (77d9d02) x86_64 x86_64 x86_64 GNU/Linux
还有 OpenSuse Leap 15.3 和 KDE Plasma 5
当我从 USB 记忆棒运行操作系统安装时,我得到了分区检查,它在哪里爆炸:-(/usr/bin/udevadm /dev/sdd1 could not be found (failed)
我不记得确切的错误文本,没有重新运行安装过程,但这是要点它)
去年(2021 年 4 月)我在丢失/home
数据时遇到问题,不得不将非 RAID 磁盘带到数据恢复公司。从记忆中,我认为它原来是一个 GPT 错误,修复它只是昂贵而不是天文数字(很高兴为我的数据安全付费)。我让他们将所有/home
数据从该磁盘传输到我购买的两个 1TB WD Black 磁盘之一。我用两个新磁盘设置了 RAID-1,直到最近这似乎都很好!
关于我为什么要重新安装(在水平线之间)的上下文部分可能/可能不相关?
奇怪的事情发生了,我不知道它们是否相关,但它们看起来很系统 - 比如:
- Firefox 标签在某些网站上立即开始崩溃,我认为/认为这可能是 Firefox 错误
- Python 停止工作,导致不相关的程序失败(主要是 Libre-Office - 不断进入恢复),但 FreeCAD(主要基于 Python)仍然有效
- Corel AftershotPro 由于缺少/不正确的版本库(仍然存在)而无法启动
我尝试的许多修复似乎又回到了 Python。最后,我删除了 Python,它卸载了许多关键操作系统的东西(尤其是 GUI),然后我重新安装了它(以及大多数已自动卸载的项目。即使这样也没有用,所以我想我'会重新安装操作系统 - 认为我的/home
数据是安全的。正如我所提到的,情况似乎并非如此,它正在停止我的重新安装以稳定我的计算机。
试过:
lsblk
<snipped the loop devices>
sda 8:0 0 931.5G 0 disk
└─sda1 8:1 0 931.5G 0 part
└─md127 9:127 0 931.5G 0 raid1
└─md127p1 259:0 0 931.5G 0 part /home
sdb 8:16 0 1.8T 0 disk
└─sdb1 8:17 0 1.8T 0 part
└─cr-auto-1 254:0 0 1.8T 0 crypt /china2
sdc 8:32 0 111.8G 0 disk
├─sdc1 8:33 0 148M 0 part
├─sdc2 8:34 0 100G 0 part /
├─sdc3 8:35 0 2G 0 part
└─sdc4 8:36 0 2G 0 part
sdd 8:48 0 931.5G 0 disk
sde 8:64 0 1.8T 0 disk
└─sde1 8:65 0 1.8T 0 part /chinaPhotos
注意sda/sda1/md127/md127p1
在这里安装为/home
我猜sda
&sdd
是有贡献的物理RAID设备,sdd
是坏的吗?
我尝试了以下方法:(显示/home
的是/dev/md127p1
)
df -h
Filesystem Size Used Avail Use% Mounted on
devtmpfs 4.0M 0 4.0M 0% /dev
tmpfs 7.8G 243M 7.5G 4% /dev/shm
tmpfs 3.1G 335M 2.8G 11% /run
tmpfs 4.0M 0 4.0M 0% /sys/fs/cgroup
/dev/sdc2 100G 38G 63G 38% /
/dev/sdc2 100G 38G 63G 38% /.snapshots
/dev/sdc2 100G 38G 63G 38% /boot/grub2/i386-pc
/dev/sdc2 100G 38G 63G 38% /boot/grub2/x86_64-efi
/dev/sdc2 100G 38G 63G 38% /opt
/dev/sdc2 100G 38G 63G 38% /root
/dev/sdc2 100G 38G 63G 38% /srv
/dev/sdc2 100G 38G 63G 38% /tmp
/dev/sdc2 100G 38G 63G 38% /var
/dev/sdc2 100G 38G 63G 38% /usr/local
/dev/sdb1 1.8T 1.7T 94G 95% /chinaPhotos
/dev/md127p1 932G 402G 530G 44% /home
<snipped loop devices>
/dev/mapper/cr-auto-1 1.9T 1.5T 399G 79% /china2
tmpfs 1.6G 72K 1.6G 1% /run/user/1000
/dev/sdm 3.4M 3.3M 116K 97% /run/media/░░░░/SBEAM
/dev/sdn 1.6M 24K 1.6M 2% /run/media/░░░░/UPDATE
192.168.░░░.░░░:/volume1/DataBackup 2.7T 2.3T 492G 83% /░░░░░
<snipped loop devices>
最后,我试过了
mdadm --detail /dev/md*
mdadm: /dev/md does not appear to be an md device
/dev/md127:
Version : 1.0
Creation Time : Sun Apr 25 17:58:55 2021
Raid Level : raid1
Array Size : 976761344 (931.51 GiB 1000.20 GB)
Used Dev Size : 976761344 (931.51 GiB 1000.20 GB)
Raid Devices : 2
Total Devices : 1
Persistence : Superblock is persistent
Intent Bitmap : Internal
Update Time : Sun Mar 6 19:26:29 2022
State : clean, degraded
Active Devices : 1
Working Devices : 1
Failed Devices : 0
Spare Devices : 0
Consistency Policy : bitmap
Name : any:home
UUID : 75959fa2:f25b6088:7a9e9a80:c1f38480
Events : 3183874
Number Major Minor RaidDevice State
0 8 1 0 active sync /dev/sda1
- 0 0 1 removed
/dev/md127p1:
Version : 1.0
Creation Time : Sun Apr 25 17:58:55 2021
Raid Level : raid1
Array Size : 976760303 (931.51 GiB 1000.20 GB)
Used Dev Size : 976761344 (931.51 GiB 1000.20 GB)
Raid Devices : 2
Total Devices : 1
Persistence : Superblock is persistent
Intent Bitmap : Internal
Update Time : Sun Mar 6 19:26:29 2022
State : clean, degraded
Active Devices : 1
Working Devices : 1
Failed Devices : 0
Spare Devices : 0
Consistency Policy : bitmap
Name : any:home
UUID : 75959fa2:f25b6088:7a9e9a80:c1f38480
Events : 3183874
Number Major Minor RaidDevice State
0 8 1 0 active sync /dev/sda1
- 0 0 1 removed
安装过程识别/dev/sdd
为问题,但似乎与以下问题相同fdisk
。
fdisk /dev/sdd
Welcome to fdisk (util-linux 2.36.2).
Changes will remain in memory only, until you decide to write them.
Be careful before using the write command.
The primary GPT table is corrupt, but the backup appears OK, so that will be used.
和
fdisk /dev/sda
Welcome to fdisk (util-linux 2.36.2).
Changes will remain in memory only, until you decide to write them.
Be careful before using the write command.
Command (m for help): v
No errors detected.
Header version: 1.0
Using 1 out of 128 partitions.
A total of 2014 free sectors is available in 1 segment.
计算机大部分工作正常,我已经备份了 /home 的大部分数据,但更新正在备份,我无法安全地重新安装。
在硬件方面,依次物理移除每个 RAID 磁盘(首先关闭 PC,obvs) - 其中一个磁盘对启动没有影响(所有工作都在重新启动),但移除另一个会停止启动过程,所以我猜第二个是工作 RAID /dev/sda
-/home
磁盘,前者是“损坏”的磁盘/dev/sdd
!我还尝试将坏掉的那根换成正在工作的那根 SATA 电缆,以防万一那是问题,但没办法!
我可以运行哪些进一步的诊断/操作:
- 看看我关于该磁盘是故障磁盘的假设是否正确
- 找出它有什么问题,以及它是终端问题还是可修复问题(这些磁盘有 3 或 5(?)年保修,但它们只有不到 1 年的历史。)
- 格式化它或以其他方式恢复它并将其添加回 RAID1 阵列(或者我应该更换它吗?)
修复它使用
gdisk /dev/sdd
gdisk/fdisk 修复不起作用,如果您愿意,请再次删除它,但我已尝试在我拥有的所有 512GB 设备上使用它,他们报告问题已修复。但是,使用 g/fdisk 重新检查再次显示完全相同的错误。正如我在我现在已删除的帖子中所说,这只出现在 512GB 设备中。我所有其他更小或更大的 512GB SD 卡、USB 和我的 1T 外置 SSD 从来没有让我感到任何悲伤,而 512GB 的所有东西都有。您的体验可能有所不同,但这位硬件技术人员在这里发现了不涉及硬件的问题。