Домашний мини сервер перезагружается

Автор Efim25, 04 октября 2021, 07:29:52

« назад - далее »

0 Пользователи и 1 гость просматривают эту тему.

Efim25

Здравствуйте!

Есть домашний мини сервер на Debian 10.10, на котором стоит proxmox
недавно заметил (при замене жестких дисков - перенес на диски большего размера), что он периодически перезагружается, что не очень хорошо и причину понять не могу 

сразу скажу, что уровень у меня не высокий. в логах что смог просмотрел (val/log/...) во время когда произошел перезапуск, ни чего особенного не написано , понять не могу на программном это уровне или умирает железо

гугление в интернете тоже особо ни чего не дало

miuser   pts/0                5.4.140-1-pve    Sun Oct  3 13:28 - 15:01  (01:33)
runlevel (to lvl 5)           5.4.140-1-pve    Sun Oct  3 13:28 - 15:01  (01:32)
miuser   pts/0                192.168.0.55     Sun Oct  3 14:55 - 15:01  (00:06)
shutdown system down  5.4.140-1-pve    Sun Oct  3 15:01 - 15:03  (00:01)
reboot   system boot      5.4.140-1-pve    Sun Oct  3 15:03   still running
runlevel (to lvl 5)           5.4.140-1-pve    Sun Oct  3 15:03 - 09:22  (18:18)
reboot   system boot      5.4.140-1-pve    Mon Oct  4 09:21   still running
runlevel (to lvl 5)           5.4.140-1-pve    Mon Oct  4 09:22   still running
miuser  pts/0                192.168.0.55     Mon Oct  4 12:20   still logged in

я знаю, что в 9.20 сервер ребутнулся, но почему ? 

dzhoser

Ubuntu->Linux mint->Astra Linux SE->Debian 12
Для новичков

Efim25

Цитата: dzhoser от 04 октября 2021, 08:19:58Покажите для начала

Здравствуйте!

Открыть содержимое (спойлер)

dmesg | grep -i "error\|warn\|fail"
[    0.051758] ACPI BIOS Warning (bug): 32/64X length mismatch in FADT/Pm1aEventBlock: 32/8 (20190816/tbfadt-569)
[    0.051760] ACPI BIOS Warning (bug): 32/64X length mismatch in FADT/Pm1aControlBlock: 16/8 (20190816/tbfadt-569)
[    0.051762] ACPI BIOS Warning (bug): 32/64X length mismatch in FADT/PmTimerBlock: 32/8 (20190816/tbfadt-569)
[    0.051764] ACPI BIOS Warning (bug): 32/64X length mismatch in FADT/Gpe0Block: 64/8 (20190816/tbfadt-569)
[    0.051765] ACPI BIOS Warning (bug): 32/64X length mismatch in FADT/Gpe1Block: 128/8 (20190816/tbfadt-569)
[    0.051767] ACPI BIOS Warning (bug): Invalid length for FADT/Pm1aEventBlock: 8, using default 32 (20190816/tbfadt-674)
[    0.051768] ACPI BIOS Warning (bug): Invalid length for FADT/Pm1aControlBlock: 8, using default 16 (20190816/tbfadt-674)
[    0.051770] ACPI BIOS Warning (bug): Invalid length for FADT/PmTimerBlock: 8, using default 32 (20190816/tbfadt-674)
[    0.344648] ACPI Error: AE_NOT_FOUND, While resolving a named reference package element - \_PR_.CPU0 (20190816/dspkginit-440)
[    0.358394] acpi PNP0A08:00: _OSC failed (AE_NOT_FOUND); disabling ASPM
[    1.241129] RAS: Correctable Errors collector initialized.
[    1.364865] ACPI Warning: SystemIO range 0x0000000000001C40-0x0000000000001C7F conflicts with OpRegion 0x0000000000001C40-0x0000000000001C45 (\_SB.PCI0.SM01) (20190816/utaddress-213)
[    1.364870] ACPI Warning: SystemIO range 0x0000000000001C40-0x0000000000001C7F conflicts with OpRegion 0x0000000000001C40-0x0000000000001C45 (\_SB.PCI0.SM00) (20190816/utaddress-213)
[   25.202924] random: 7 urandom warning(s) missed due to ratelimiting
[   36.432977] EXT4-fs (sda1): re-mounted. Opts: errors=remount-ro
[   37.106801] megaraid_sas 0000:02:00.0: 947745 (686622114s/0x0008/FATAL) - Battery has failed and cannot support data retention. Please replace the battery
[   37.387712] megaraid_sas 0000:02:00.0: 947748 (686622114s/0x0008/FATAL) - Battery has failed and cannot support data retention. Please replace the battery

[свернуть]

пока из ошибок нашел только dpve ceph-crash[552]: WARNING:ceph-crash:post /var/lib/ceph/crash
может ли к зависанию приводить ceph и ceph -s висит (видимо надо чинить ceph)

dzhoser

#3
ЦитироватьBattery has failed and cannot support data retention. Please replace the battery
Поменяйте батарею на биос.
Ubuntu->Linux mint->Astra Linux SE->Debian 12
Для новичков

Efim25

#4
Цитата: dzhoser от 04 октября 2021, 08:44:49Поменяйте батарею на биос

вы думаете что это из-за батарейки? (и ошибка батареи раид контроллера - хотя при старте сам контроллер говорит, что на заряжена и работает(у меня уже как то выходила батарея из строя))

dzhoser

Да из за нее разваливается raid
Цитировать[   36.432977] EXT4-fs (sda1): re-mounted. Opts: errors=remount-ro
[   37.106801] megaraid_sas 0000:02:00.0: 947745 (686622114s/0x0008/FATAL) - Battery has failed and cannot support data retention. Please replace the battery
[   37.387712] megaraid_sas 0000:02:00.0: 947748 (686622114s/0x0008/FATAL) - Battery has failed and cannot support data retention. Please replace the battery
Возможно проблема в контактах. Но направление я Вам задал куда копать.
Ubuntu->Linux mint->Astra Linux SE->Debian 12
Для новичков

Efim25

Цитата: dzhoser от 04 октября 2021, 08:54:37Да из за нее разваливается raid

из-за нее не разваливается, вообще и без нее работать может, она как дополнительная подстраховка, на случай пропадания света хранит информацию о незавершенных операция и ни чего более


ок. спасибо, посмотрю, там не сложно

endru

в dmesg ничего криминального нет, да и что он покажет после перезагрузки то?

смотрите другие логи:
grep /var/log/*.log -i "error\|fail"

Проверяйте память, возможно какая то битая. memtest в помощь.

Проверяйте на физические повреждения материнку.

Efim25

#8
Цитата: endru от 04 октября 2021, 09:35:00grep /var/log/*.log -i "error\|fail"
grep в таком формате ни чего не дал

память проверю позже, есть подозрение на проксмокс - так как в нете находил тоже проблему с зависанием, в итоге решалось переустановкой - чего бы не хотелось

руками в логах нашел только ceph-crash ( ceph в командной строке не отвечает)

Efim25

Решение проблемы - отключение Е1 в биос (видимо конфликт энергосберегайки ЦПУ с системой)