Na manhã de segunda-feira passada, descobri que meu servidor não pode executar nenhum comando e mostra "erro de saída de entrada". Com tentado por meia hora, descobri que o único comando que pode ser executado é sudo poweroff -f
(deve usar o sinalizador -f
ou recebi "erro de saída de entrada").
E eu inicializo o servidor manualmente e verifique o log do sistema, mas não tenho nada de especial. E fiz um teste smartctl para confirmar se há algum problema com o disco rígido. E passou sem erro.
Então nesta segunda-feira esse problema aparece novamente. Eu desliguei o servidor e inicializei manualmente, e parece que nada aconteceu. Então eu uso msmtest86 8.2 test se se o memory stick estiver ok. E certifique-se de que o cabo SATA e o disco rígido estejam em boas condições e conectados de forma confiável.
Eu acho que talvez seja o problema com o sistema operacional ou sistema de arquivos? Meu sistema operacional é o Debian 8.11. Voçê pode me dar algum conselho? Obrigado a todos!
relate perguntas
-
Configuração do GRUB para reconhecer diferentes ambientes de desktop (instalações) da mesma distribuição Linux
-
astyle não altera a formatação do arquivo de origem
-
Recebendo e-mail em um novo Debian fresco
-
Debian Stretch: gnome-software segfault em libgs_plugin_systemd-updates.so
-
Como digitar ü no Pinyin IME?
O código de erro
EIO
("Erro de entrada/saída") na inicialização do comando ocorreria quando seu sistema de arquivos estivesse danificado; ou pior, quando você está executando em um armazenamento defeituoso.Cruze seus dedos; de qualquer forma, esteja ciente de que, neste momento , você NÃO deve tentar ligar o servidor a menos que seja realmente necessário . 1
O teste
Existe uma maneira infalível de distinguir entre duas causas principais: conduzir uma varredura de leitura em nível de bloco no sistema e observar as mensagens do kernel.
dmesg -E
para habilitar a exibição de mensagens do kernel ao vivo no console.dmesg -n debug
para deixar a mensagem do kernel de baixo nível.blkid
para ver qual disco contém a partição do sistema. (Observe queblkid
listará as partições; retire o número do final do caminho da partição e você obterá o disco)time -p dd if=/dev/sda of=/dev/null bs=4M
para realizar um teste de leitura de disco inteiro (digite-o com cuidado). Se o disco do sistema não for/dev/sda
, substitua-o adequadamente.Resultados
Na melhor das hipóteses, quando
dd
concluído com sucesso e sem intercorrências, é provável que seja um problema no sistema de arquivos.fsck.mode=force
anexado ao final da linha de comando do kernel. (Veja esta pergunta para detalhes)No entanto, na pior das hipóteses , você veria mensagens do kernel como esta sendo lançadas na tela:
Procure as peças principais:
DRDY
,ERR
eUNC
em colchetesMedium Error
statusUnrecovered read error
mensagem de sentidoSe você olhou e os encontrou nas mensagens (mesmo uma vez), eles mostram que você está enfrentando um erro de disco físico.
Quando este for o caso, não deixe
dd
terminar, pressione Ctrl+C para parar, AGORA ; desligue seu sistema e leve seu disco para uma loja de recuperação de dados de sua confiança.Se você não encontrou os indicadores de pior caso acima e, em vez disso, encontrou esse tipo de mensagem do kernel repetida:
Partes principais:
hard resetting link
link is slow to respond
Então você está enfrentando um problema de link SATA (por exemplo, cabeamento ruim): pressione Ctrl + C para parar, desligue o sistema, conserte o cabo e a conexão do disco e tente novamente.
Notas Laterais
Cuidado que alguns discos rígidos contam mentiras diretas em seu status SMART (estou olhando para você, Toshiba); meu disco rígido anterior do laptop simplesmente parou ao ler, vomitando erros de leitura, e ainda dizia "nada está errado" em seus registros de status.
Se o seu servidor for de missão crítica, você deve considerar a configuração baseada em RAID .
1 Conto de advertência: Meu companheiro de casa uma vez ignorou este aviso e manteve o verificador do sistema de arquivos trabalhando em seu sistema desktop de qualquer maneira. Ele não esperou que eu verificasse até que ele finalmente falhou ao inicializar . Assim que tive a chance de verificá-lo, o dano do disco já estava além da recuperação (o disco de 500 GB mal conseguia ler em KB/s em ritmo de caracol, e não havia nenhuma área legível contínua significativa encontrada mesmo depois de vários dias).
Por outro lado, em outro caso com o mesmo sintoma, o dono da máquina atendeu ao meu aviso e deixou a coisa desligada até que eu pudesse verificar. Claro, foi uma falha no disco rígido. Após meio dia de sessão GNU DDRescue e um novo disco rígido, eu trouxe uma boa notícia para ele de que seu sistema e dados estavam 100% recuperados no nível de bloco - ou seja, todos os arquivos intactos e prontos para inicializar novamente sem nenhuma modificação.
Eu encontrei esse erro no meu servidor linux (executando o Debian 10) ao navegar pelas pastas e acessar os arquivos, apesar da unidade ter passado em todos os testes SMART. Não consegui resolver o problema usando nenhuma das respostas postadas no Stackexchange.
Eu estava usando um HDD de 2,5" em um compartimento de unidade de 3,5" e acontece que a unidade vibrou do conector SATA. Desliguei o servidor e conectei a unidade novamente com firmeza e os erros desapareceram.