Как логировать системный сбой, узнать от чего резко выключается Debian 11

Автор SinisterFoxy, 22 сентября 2022, 10:27:18

« назад - далее »

0 Пользователи и 1 гость просматривают эту тему.

ogost

граммар наци
1."троттлинг", он же throttling; хотя это больше похоже на автокоррекцию в перемешку с попыткой поправить с телефона.
2. "крИтические температуры". а вот тут автокоррекция подвела.

всем бобра!
[свернуть]

SinisterFoxy

В общем, продолжение истории:
Сегодня работал в Jupyter Lab, в одном из ноутбуков, был код, который, очень сильно нагружает "камень". Один раз поставил "обучаться" модель, и пошёл кофейка заварить. Прихожу, а он перезагрузился, но не полностью. Блок питания подаёт "напругу" на материнку, светодиод питания горит, хард крутится-вертится, а не запускается.
Выключил через долгое удержание кнопки питания, потом включил(сразу же), не запускается.

Выключил уже через кнопку на самом БП, сзади корпуса, подождал несколько минут, включил...не запускается(светодиод кнопки питания горит, хард раскручивает, но не запускается ПК, нет одиночного сигнала, который обычно появляется).

Выключил обратно через кнопку на самом БП, оставил так на минут 5-7, включил, "завёлся"ПК.



30 сентября 2022, 10:42:45
Обратно запускаю Jupyter Lab, запускаю тот код(который нагружает проц), сижу, в сети"капиталистической" просматриваю веб страницы, БАЦ! Зависает всё, ничто не реагирует(ни мышь ни клава), и выключается экран. НО!!! Не выключается сам ПК, то-есть, сам ПК не выключается, но выключается экран, и не включается. Обратно выключаю через кнопку на самом БП, жду минут 5, включаю, всё включается.

Код в JupyterLab-е не задействует GPU, по крайней мере я нигде не прописывал команды для этого, более того, у меня не установлены либы для работы с GPU.

Как думаете, вскрыть БП? Посмотреть на внутренности, может capcitor какой взбух? Если высыхают кондёры, можно как-нибудь это определить?

Может проц, перегревается? На данный момент у меня открыт браузер и два терминала. Нагрев на камне: 45-48 градусов. Камень Intel(R) Core(TM) i7-3770 CPU @ 3.40GHz.

Может видеокарта? Но её я не напрягаю, игры забросил уже лет 8-10 назад.
I'm learning how to teach a machine how to learn. :-)

yoric

Цитата: SinisterFoxy от 30 сентября 2022, 10:31:53Как думаете, вскрыть БП? Посмотреть на внутренности, может capcitor какой взбух? Если высыхают кондёры, можно как-нибудь это определить?
Запросто, может чего и увидите. Высохшие только измерением, бывает, и без выпайки. В общем, похоже на аппаратную проблему, БП мать проц память

SinisterFoxy

Вот, выключается только экран, и включается(после перезагрузки через кнопку) только если подождать минут, эдак, 5-10.
Или на видеокарту питания не хватает, вот она и выключается. Может всё питание камень забирает, БП у меня, тоже, не первой свежести.
Или проц греется.
I'm learning how to teach a machine how to learn. :-)

Susumo

Вероятнее всего БП, ещё при смерти харда похожие симптомы, но температура харда при этом высокая, рука не терпит, проц при перегреве тротлить начинает, видяха то-же, оперативка кернел-паник, а после перезагрузки долгая её инициализация биосом. Не профи, просто личный опыт, все может быть совсем не так.

SinisterFoxy

Susumo,Тоже думаю про БП. Не хватает питания для видеокарты(а может для другого). Скоро(сегодня) ещё раз нагружу проц, и смотреть буду на сенсоры, может что увижу. А потом, сниму БП, просмотрю, и на кулере камня поменяю термопасту.

30 сентября 2022, 16:02:24
В общем, вскрыл БП, ничего такого не заметил, кроме как пыли много.
Мне кажется, что дело в нагреве камня(процессора), греется он сильно. Я когда открыл корпус пк, горячий воздух прям чувствовался. Плохое охлаждение проца, термопасту менял, но кулер у меня стоит штатный, придётся закупаться новым, более мощным.
Затем, при попытке включения пк, пк не запускался, а не запускался он из-за ОЗУ, одна планка накрылась походу.
Недавно, точно такая же планка озу(две, эти планки я покупал вместе, очень давно, лет 5-6 назад) точно так-же, не запускала пк.
Надо будет новую купить.
Может из-за температуры в корпусе, озу отключалась? Когда остывала, то запускалась.
I'm learning how to teach a machine how to learn. :-)

yoric


Aalexeey

Цитата: SinisterFoxy от 30 сентября 2022, 12:35:17одна планка накрылась походу
Вы погодите драматизировать, для начала разъём/гнездо памяти очень аккуратно пропылесосьте и не мене аккуратно сухой натуральной тряпкой протрите медленно контакты самой памяти. Бывает что одна ворсинка на контакте может не продавиться и память глючит.
По процессору, расскажу как я "наношу" пасту, в центр процессора красивую каплю размером с горошину, и затем кулером медленно и аккуратно давите и она без единого пузыря расходится в стороны, лишнее выдавленное не проблема. Горошина должна быть аккуратной и гладкой, так не образуются пузыри в процессе её выдавливания, можно придать ей предварительно также аккуратно гладкую квадратную форму ориентируясь на углы проца.  Естественно это про не токопроводящую пасту, наша КПТ-8 тоже отлично для этого подходит, если она не подделка то не сохнет годами и выдавливается хорошо.  Когда аккуратно придавите, поднимать уже нельзя, запустите воздух, не будет хорошим тепловой контакт. 
https://debianforum.ru/index.php?topic=6879 100% защиты от "Ааааа у меня всё поломалось"

dzhoser

Ubuntu->Linux mint->Astra Linux SE->Debian 12
Для новичков

SinisterFoxy

Цитата: yoric от 30 сентября 2022, 18:37:40memtest запустите, на подольше. Для начала.
А как запустить мэмтест если пк не запускается?
I'm learning how to teach a machine how to learn. :-)

dzhoser

Давайте протестируем процессор для начала
sudo apt install sysbench -ysudo sysbench --num-threads=4 --test=cpu --cpu-max-prime=100000 runВместо 4 введите ваше количество ядер (виртуальные тоже считаются)
100000 максимальное количество выполненных операций (влияет на время выполнения теста)
Завершение теста закрытие терминала или CRTL+C
Ubuntu->Linux mint->Astra Linux SE->Debian 12
Для новичков

SinisterFoxy

I'm learning how to teach a machine how to learn. :-)

dzhoser

У вашего процессора 
Расчетная мощность 77 W (можно посмотреть на сколько рассчитан куллер)
Спецификации системы охлаждения 2011D
TCASE 67.4°C
TJUNCTION 105°C
То есть температура выше 105 градусов не должна подниматься.
К тому же у вас встроенная графика вытащить видеокарту для диагностики можно.
Для тестирования памяти
sudo apt install memtest86+ -yСоответствующий пункт будет добавлен в меню grub.

Ubuntu->Linux mint->Astra Linux SE->Debian 12
Для новичков

SinisterFoxy

Завтра в командировку, потом приеду с работы, проверю.
Всем спасибо!
I'm learning how to teach a machine how to learn. :-)

Susumo

Проверьте кулер на БП он отвечает за отвод теплого воздуха из корпуса. Потестируйте проц с открытой крышкой корпуса.