Eu tenho uma pequena máquina Celeron que executa o Ubuntu 16.04.3 LTS e toda vez que preciso reiniciá-la (cerca de uma vez por mês), tenho que desligá-la, puxar o plugue e ligá-la novamente.
O problema é que ele não reinicia automaticamente, porque para com uma mensagem Reached target Shutdown
. Então parei de usar sudo reboot
, mas sudo poweroff
em vez disso faço um e logo em seguida aparece essa mensagem.
Quando espero alguns minutos, uma mensagem adicional é exibida 3102533.654120 unregister_netdevice: waiting for lo to become free. Usage count=1
. O segundo contador (como na medição de tempo) é alto, cerca de 3102533, o que equivale a cerca de 36 dias, provavelmente a hora da última reinicialização. Portanto, ainda há algo sendo executado em segundo plano emitindo essa mensagem.
Como isso já aconteceu antes e a maioria dos acessos do Google está relacionada ao Docker, certifiquei-me de interromper todos os contêineres docker stop $(docker ps -a -q)
e desligar o serviço docker sudo systemctl stop docker
antes de emitir o arquivo sudo poweroff
.
Nesse estranho estado de desligamento, também não é possível desligar a máquina com um pressionamento normal do botão liga / desliga (um pressionamento muito longo desliga, iirc) e um pressionamento do botão de reinicialização também não reinicia a máquina, o que eu acho ser muito estranho. É um http://www.asrock.com/mb/Intel/N3150DC-ITX/
O que mais me preocupa é o fato de que a luz do "hdd" (é um ssd) fica piscando esporadicamente, como se estivesse interagindo com o disco, o que me dá medo de corromper alguma coisa ao puxar o plugue da tomada. https://www.youtube.com/watch?v=T3ojE1un7WE
É seguro puxar o plugue? Como posso rastrear a causa desse problema? Não posso fazer muita reinicialização com a máquina, pois ela hospeda alguns bancos de dados que são constantemente acessados.
Acima foi em 12 de fevereiro, o que segue é em 16 de março
Acabei de "reiniciar" a máquina novamente. Mesmo procedimento acima, pois não desliga.
Desta vez não fiz apt upgrade/dist-upgrade
antes de reiniciar, fiz isso depois, para ter certeza de que algo que está sendo atualizado não é a causa desse problema.
Pressionei ctrl-alt-del algumas vezes enquanto esperava desligar, não surtiu efeito, até que apareceu uma mensagem:
Ctrl-Alt-Del foi pressionado mais de 7 vezes em 2s, reiniciando imediatamente
(não acho que os pressionei tão rapidamente, acredito que eles foram armazenados em cache de alguma forma ou pressionei por muito tempo) seguido por um
2697473.41.. systemd-shutdown[1]: Falha ao finalizar os dispositivos DM, ignorando (o espaço extra antes do DM faz parte dessa mensagem)
e então um
2697473.63.. reboot: Reiniciando o sistema
Mas não reiniciará, a luz do HDD ainda piscará ocasionalmente, a tela não limpará as mensagens.
Pressionar o botão de reinicialização não reinicializa a máquina. O botão não está com defeito.
Um pressionamento longo do botão liga/desliga desliga a máquina. Outra pressão o reinicia, então o botão de reset funciona conforme o esperado, posso pressioná-lo a qualquer momento e fará com que o sistema reinicie imediatamente.
Depois de ligado, fiz o apt update/upgrade/dist-upgrade e sudo poweroff'ed novamente. Ele desligou muito bem.
Há algo realmente estranho acontecendo quando a máquina fica ligada por dias, o que deve estar causando esse problema.
Estou usando molly-guard
, não tenho certeza se isso pode causar alguns problemas. Quando eu emito o sudo shutdown
faço localmente no teclado anexo, então molly-guard
não tem efeito. Mas duvido que essa molly-guard
seja a fonte do problema.
Eu fiz um top -b > test-pre-reboot-no-upgrade.txt
antes de emitir o sudo shutdown
, aqui está a saída https://pastebin.com/nZnJzRKu
Tente adicionar parâmetro
nolapic
emgrub.cfg
corre
sudo update-grub
https://help.ubuntu.com/community/BootOptions
me ajudou
tentei esses parâmetros aqui
noapic
nolapic
noacpi
irqpoll
noapm
nodma
nomce
caso contrário, não ajudou. Resolvido a questão - initramfs recompilado:
sudo update-initramfs -u
Eu acho que esse problema estava relacionado a ter um disco rígido/ssd montado.
O que estou fazendo é que no crontab eu tenho um
startup.sh
script de shell @reboot que é executado pelo usuário principal (uid 1000), e esse script monta o hdd (costumava ser um hdd, agora é um ssd):sudo mount /dev/sdb1 /media/ssd1
O que fiz então foi criar um
shutdown.sh
script que funciona assim:Com isso, posso desligar e reiniciar o sistema. Portanto, talvez estivesse relacionado a não desmontar explicitamente a unidade e também não emitir uma sincronização antes de um desligamento/reinicialização.
Conforme mencionado nos comentários, notei que um contêiner (RabbitMQ) estava gerando um enorme arquivo de log (cresceu para cerca de 40 GB). Talvez a sincronização deste arquivo estivesse causando o problema, onde ele tentou sincronizá-lo neste estado quase desligado. Mas não tenho certeza, porque tive esse problema desde o início e, AFAIK, não estava executando o RabbitMQ inicialmente.