debian или его "родственник" периодически полностью зависают

Автор vadd, 04 декабря 2015, 21:33:32

« назад - далее »

0 Пользователи и 3 гостей просматривают эту тему.

vadd

Цитата: CoolAller от 07 декабря 2015, 03:47:3599% хардварная проблема, стресс-тест Everest (хорошо показывает деградацию памяти и таймингов, даже когда Memtest показывает что все OK), OCCT (цепи питания, в т.ч. блок), FurMark, не забываем мониторить температуру и основные напряжения во время тестов). 

Погонял по 10 минут furmark и Aida64-Everest.  Тайминги полностью адекватные системе, напряжения питания стабильны и не проседают, температура ни по процу, ни и по матплате под конец теста не выше 50 с хвостиком, на ощупь по радиаторам - так и есть.  Сбоев, само собой, тоже не было, все тесты шли гладко.   
Короче, если и хардварная проблема, то очень загадочная, которая не ловится ни одной системой,  ни одним тестом, включая стресс,  а только дебианом.

grek

Была такая-же проблема на ноутбуке A9Rp (правда, это началось лет через 5 его эксплуатации) - ATI'шный видеочип (не помню уже какой, т.к. продал тот ноутбук). Под XP редко-редко зависало, а вот под Debian'ом, ALT Linux'ом - вис намертво. Короче, открыл я его и заменил термопасту под процессором и терморезину под видеочипом, причем положил двойной слой, это помогло - виснуть перестал.

CoolAller

#17
Цитата: vadd от 07 декабря 2015, 12:38:31Погонял по 10 минут
Так понятно почему не ловится, там минимум 40-60 минут нужно каждый тест проводить. Было не мало комплектов памяти, которые сбоили не сразу, деградировали чипы, не держали заявленные тайминги и частоту, нормально работали только с поднятием напряжения. У вас больше похоже на неисправность GPU, на винде не появлялось сообщения о том, что видеодрайвер был восстановлен?
Цитата: vadd от 07 декабря 2015, 12:38:31напряжения питания стабильны и не проседают
Такого не бывает, проседать они будут в любом случае под нагрузкой, вопрос в том насколько.

Cообщение объединено 08 декабря 2015, 13:24:27

Цитата: grek от 07 декабря 2015, 21:21:48положил двойной слой
И получил двойной перегрев, разве что отвалившиеся BGA чипа возможно прижались)

vadd

Цитата: CoolAller от 08 декабря 2015, 13:20:34Так понятно почему не ловится, там минимум 40-60 минут нужно каждый тест проводить. Было не мало комплектов памяти, которые сбоили не сразу, деградировали чипы, не держали заявленные тайминги и частоту, нормально работали только с поднятием напряжения. У вас больше похоже на неисправность GPU, на винде не появлялось сообщения о том, что видеодрайвер был восстановлен?

Нет конечно, я бы упомянул об этом.  Система работает идеально несколько лет.  Попробую наверно погонять до часа, но особого смысла уже не вижу. За то время что я гонял, температура успела застабилизироваться.  А при желании можно и паяльной лампой погреть, чтобы сбои точно начались. Только вот вылеты дебиана происходят сразу, а не после нагрева.

Цитата: CoolAller от 08 декабря 2015, 13:20:34Такого не бывает, проседать они будут в любом случае под нагрузкой, вопрос в том насколько.

Я имел в виду что напряжения стабильны во время теста. А проседание по сравнению с "дотестовым" режимом непринципиально и незначительно.  У меня все напряжения чуть повышены, но даже под нагрузкой остаются чуть выше номинала.  Например 12,15в - 12.05в.


CoolAller

Цитата: vadd от 08 декабря 2015, 17:40:38Только вот вылеты дебиана происходят сразу, а не после нагрева.
А я и не говорил, что проблема в перегреве, я сказал, что за 10 минут тест может ничего не показать.

vadd

Цитата: CoolAller от 08 декабря 2015, 22:14:35
Цитата: vadd от 08 декабря 2015, 17:40:38Только вот вылеты дебиана происходят сразу, а не после нагрева.
А я и не говорил, что проблема в перегреве, я сказал, что за 10 минут тест может ничего не показать.

Я к тому, что поскольку ни круглосуточная многолетняя эксплуатация, ни стресс-тесты ничего не выявили - то такую систему можно считать полностью здоровой и менять хард смысла нет.  Попробую при случае замену драйвера как единственное практичное решение.

PS. Кстати, обнаружил еще такой нюанс.  На моей матплате версия биос старенькая, 2.  На той, однотипной, где флэшка проверялась и стабильно работала - версия новее, 4.  Может ли это приводить к такой проблеме? 

CoolAller

Я бы пробовал методом исключения. Какая у вас мат плата? Сколько планок памяти и какие? Какая видеокарта, производитель. Нужно больше информации.

vadd

Цитата: CoolAller от 09 декабря 2015, 03:58:54Я бы пробовал методом исключения. Какая у вас мат плата? Сколько планок памяти и какие? Какая видеокарта, производитель. Нужно больше информации.

С памятью пробовал.  У меня две планки памяти от разных производителей, на 2 и на 4 гига.  Эффект проявляется одинаково как с двумя планками, так и с любой из них отдельно.  Поэтому я память исключил.
О видео и матплате я написал в самом первом посте - m61pme-s2, видео на ней встроенная NVIDIA GeForce 6100/nForce 430 MCP.  Проверить с какой-то другой видео пока не могу - нет под руками.

CoolAller

#23
vadd, если предположить работоспособность интегрированного видео и памяти, то смотрите Bios, если там есть ручные настройки напряжений, то руками ставьте, не знаю какая у вас память, если обычная DDR2 667 - 1066Mhz, то ставьте с небольшим завышением, например 1.85v, безопасное до 2v (а вообще напряжение и тайминги указаны на самой планке на стикере), поскольку планки разные, то и тайминги скорее всего разные, а возможно и напряжения, пока оставьте одну планку (пробуйте вставлять ее сначала в первый, потом во второй слот), в Bios ищите турбо кеш или как он там у вас называется и ставьте руками максимально возможное значение для видеопамяти. Если есть опция "Memory Remap Feature" или "Memory Hole Remapping", то пробуйте ее отключить или наоборот задействовать. Если не поможет, то можно попробовать слегка поднять напряжение на чипсет, ничего страшного в этом нет (на плате есть электролитические конденсаторы, а плата уже не свежая, возможны потери по емкостям, а мониторинг напряжений на дешевых платах иногда оставляет желать лучшего) Явно вздутых или поврежденных электролитов насколько я понимаю нет? Можно вручную завысить штатные тайминги с шагом в 1 значение. Если все это не поможет обновите Bios.

PS. Когда вы тестили память MemTest вы хотя бы один полный проход теста до конца делали?  Надеюсь, что да, так как если не делали, то все вышеописанные телодвижения будут бесполезны. Удачи.

vadd

Цитата: CoolAller от 09 декабря 2015, 12:23:00
vadd, если предположить работоспособность интегрированного видео и памяти, то смотрите Bios, если там есть ручные настройки напряжений, то руками ставьте, не знаю какая у вас память, если обычная DDR2 667 - 1066Mhz, то ставьте с небольшим завышением, например 1.85v, безопасное до 2v (а вообще напряжение и тайминги указаны на самой планке на стикере), поскольку планки разные, то и тайминги скорее всего разные, а возможно и напряжения, пока оставьте одну планку (пробуйте вставлять ее сначала в первый, потом во второй слот), в Bios ищите турбо кеш или как он там у вас называется и ставьте руками максимально возможное значение для видеопамяти. Если есть опция "Memory Remap Feature"  или "Memory Hole Remapping", то пробуйте ее отключить или наоборот задействовать. Если не поможет, то можно попробовать слегка поднять напряжение на чипсет, ничего страшного в этом нет (на плате есть электролитические конденсаторы, а плата уже не свежая, возможны потери по емкостям, а мониторинг напряжений на дешевых платах иногда оставляет желать лучшего) Явно вздутых электролитов насколько я понимаю нет? Можно вручную завысить штатные тайминги с шагом в 1 значение. Если все это не поможет обновите Bios.

PS. Когда вы тестили память MemTest вы хотя бы один полный проход теста до конца делали?  Надеюсь, что да, так как если не делали, то все вышеописанные телодвижения будут бесполезны.

Напряжение в биосе у меня стоит номинальное, стикерам на планках соотвествует.  Повышать не хочется, я не сторонник "разогрева".  Тайминги у меня специально отпущены по "худшей" из планок, 6, медленнее уже биос не позволяет.  Мемтест работал всю ночь.   Но самый главный аргумент - дебиановская картина не меняется при работе на одной, любой из планок, поэтому на память я грешить уже не могу.
С видео посмотрю что можно сделать.
Хотя чувствую, что все это уже нарушает логику )   Я  пытаюсь подстроить работающее железо под конкретный капризничающий дистрибутив, хотя надо делать наоборот )

Yrii

vadd, так вы уже поставили debian на компьютер? после зависания проанализировали логи?
может при загрузки с флешки не отработали какие-нибудь firmware ибо их там возможно нет и что-то начинает работать некорректно?!

CoolAller

#26
Цитата: vadd от 09 декабря 2015, 13:00:18Тайминги у меня специально отпущены по "худшей" из планок
Да их не понижать, а повышать нужно. :D
Цитата: vadd от 09 декабря 2015, 13:00:18Повышать не хочется, я не сторонник "разогрева"
С такими напряжениями его не произойдет))
Цитата: vadd от 09 декабря 2015, 13:00:18Напряжение в биосе у меня стоит номинальное, стикерам на планках соотвествует.
Все бы хорошо, если бы все железо было бы только из магазина)) Про электролиты я писал выше.
Цитата: vadd от 09 декабря 2015, 13:00:18дебиановская картина не меняется при работе на одной, любой из планок, поэтому на память я грешить уже не могу.
Писал же выше, слот поменяйте.
Цитата: vadd от 09 декабря 2015, 13:00:18Я  пытаюсь подстроить работающее железо под конкретный капризничающий дистрибутив, хотя надо делать наоборот )
Очень не похоже, что это именно так, так как на идентичной материнке у вас все запускалось , а вот это уже нарушает вашу логику. :D

vadd

#27
Цитата: Yrii от 09 декабря 2015, 13:04:44
vadd, так вы уже поставили debian на компьютер? после зависания проанализировали логи?
может при загрузки с флешки не отработали какие-нибудь firmware ибо их там возможно нет и что-то начинает работать некорректно?!

Нет еще, при первой же возможности поставлю.  Хотя вылет идет полный, логи могут и не помочь. И флэшка с тэйлс ведет себя так же.  Вряд ли и на ней повторяются огрехи.

Цитата: CoolAller от 09 декабря 2015, 13:21:02
Цитата: vadd от 09 декабря 2015, 13:00:18Тайминги у меня специально отпущены по "худшей" из планок
Да их не понижать, а повышать нужно. :D

Вы меня не поняли )   "Отпущены тайминги" - значит "не зажаты" )   Естественно, поставил наибольшее возможное в биосе число.

Цитата: CoolAller от 09 декабря 2015, 13:21:02
С такими напряжениями его не произойдет))
Цитата: vadd от 09 декабря 2015, 13:00:18Напряжение в биосе у меня стоит номинальное, стикерам на планках соотвествует.
Все бы хорошо, если бы все железо было бы только из магазина)) Про электролиты я писал выше.
Цитата: vadd от 09 декабря 2015, 13:00:18дебиановская картина не меняется при работе на одной, любой из планок, поэтому на память я грешить уже не могу.
Писал же выше, слот поменяйте.
Цитата: vadd от 09 декабря 2015, 13:00:18Я  пытаюсь подстроить работающее железо под конкретный капризничающий дистрибутив, хотя надо делать наоборот )
Очень не похоже, что это именно так, так как на идентичной материнке у вас все запускалось , а вот это уже нарушает вашу логику. :D

Слоты менял, это "святое" )) 
Пока дефектов я ведь не вижу. И тесты не видят.  И главное,  почему я все-таки сомневаюсь, что дело в железе - это как происходит "вылет" - строго в момент запуска приложений.  Дефект железа ведь может сказаться в любой момент, через минуту, через пять...  А если тот же браузер у меня все-таки запустился, то он работает долго и счастливо.  Правда больше часа не гонял.

В общем, я при возможности сначала обновлю биос, потом установлю систему на партицию, потом заменю видеодрайвер.  А то  чувствую, что много споров, мало экспериментов )


vadd

#28
Невзирая на все странности, вроде помог изначально напрашивавшийся способ. Установил дравер с сайта Nvidia и все заработало относительно нормально.
Смущает, что при переключении консолей в процессе переключения (слегка заторможенном) на экране на секунду появлются полосатые артефакты - точно такие же, как были при зависании до накатки нвидишного драйвера.
Похоже, где-то остатки нувёшного драйвера в системе остались (хотя установщик вроде в процессе конфиг иксов переделал) 
В общем, хлопотное это дело - сочетать дебиановский принцип "я девушка порядочная" с реальным оборудованием )


sidbar

Цитата: vadd от 23 декабря 2015, 16:20:40Смущает, что при переключении консолей в процессе переключения (слегка заторможенном) на экране на секунду появлются полосатые артефакты - точно такие же, как были при зависании до накатки нвидишного драйвера.
У меня тоже такое есть, если бы не написали не обратил внимания)
Devuan GNU/Linux