Помогите разобраться - почему виснет джесси

Автор Sergei_Alekseev, 17 апреля 2017, 10:41:14

« назад - далее »

0 Пользователи и 1 гость просматривают эту тему.

Sergei_Alekseev

Ноутбук Asus F3JC без монитора, подключен внешний монитор по dvi.
Периодически случается kernel panic с сообщением attempt to kill init.
Последний раз это произошло во время работы в firefox, браузер перестал реагировать, судя по cpu апплету, нагрузка прекратилась, некоторое время, секунд 5, можно было переключиться на другие программы итд, потом паника. Логи из /var/log положил здесь:
http://metafight.ru/files/logs.7z
Можно в логах посмотреть из-за чего случилась паника? Где именно?
Скажите, какую предоставить инфу по системе итд.
Спасибо.

yoric

Смотрите /var/log/syslog  по времени, когда зависло, вблизи этого вперёд и назад с неким запасом (в 5 минут, например) скопируйте строчки, а всю кучу не надо. Может, и сами увидите, в чём дело. А если тихо, то подозрения на железо. Мемтест прогнать для начала.

Sergei_Alekseev

Apr 17 07:30:01 debian CRON[4924]: (root) CMD (test -x /etc/init.d/anacron && /usr/sbin/invoke-rc.d anacron start >/dev/null)
Apr 17 07:30:01 debian systemd[1]: Starting Run anacron jobs...
Apr 17 07:30:01 debian systemd[1]: Started Run anacron jobs.
Apr 17 07:30:01 debian anacron[4944]: Anacron 2.3 started on 2017-04-17
Apr 17 07:30:01 debian anacron[4944]: Normal exit (0 jobs run)
Apr 17 07:37:06 debian kernel: [ 4849.303153] sd 2:0:0:0: [sdb] Unhandled sense code
Apr 17 07:37:06 debian kernel: [ 4849.303160] sd 2:0:0:0: [sdb] 
Apr 17 07:37:06 debian kernel: [ 4849.303163] Result: hostbyte=DID_ERROR driverbyte=DRIVER_SENSE
Apr 17 07:37:06 debian kernel: [ 4849.303166] sd 2:0:0:0: [sdb] 
Apr 17 07:37:06 debian kernel: [ 4849.303168] Sense Key : Hardware Error [current] [descriptor]
Apr 17 07:37:06 debian kernel: [ 4849.303172] Descriptor sense data with sense descriptors (in hex):
Apr 17 07:37:06 debian kernel: [ 4849.303174]         72 04 00 00 00 00 00 0e 09 0c 00 00 00 00 00 00
Apr 17 07:37:06 debian kernel: [ 4849.303184]         00 00 00 00 00 50
Apr 17 07:37:06 debian kernel: [ 4849.303191] sd 2:0:0:0: [sdb] 
Apr 17 07:37:06 debian kernel: [ 4849.303193] Add. Sense: No additional sense information
Apr 17 07:37:06 debian kernel: [ 4849.303196] sd 2:0:0:0: [sdb] CDB:
Apr 17 07:37:06 debian kernel: [ 4849.303199] ATA command pass through(12)/Blank: a1 06 20 00 00 00 00 00 00 e5 00 00
Apr 17 07:47:06 debian kernel: [ 5449.844516] sd 2:0:0:0: [sdb] Unhandled sense code
Apr 17 07:47:06 debian kernel: [ 5449.844529] sd 2:0:0:0: [sdb] 
Apr 17 07:47:06 debian kernel: [ 5449.844535] Result: hostbyte=DID_ERROR driverbyte=DRIVER_SENSE
Apr 17 07:47:06 debian kernel: [ 5449.844542] sd 2:0:0:0: [sdb] 
Apr 17 07:47:06 debian kernel: [ 5449.844546] Sense Key : Hardware Error [current] [descriptor]
Apr 17 07:47:06 debian kernel: [ 5449.844555] Descriptor sense data with sense descriptors (in hex):
Apr 17 07:47:06 debian kernel: [ 5449.844559]         72 04 00 00 00 00 00 0e 09 0c 00 00 00 00 00 00
Apr 17 07:47:06 debian kernel: [ 5449.844584]         00 00 00 00 00 50
Apr 17 07:47:06 debian kernel: [ 5449.844599] sd 2:0:0:0: [sdb] 
Apr 17 07:47:06 debian kernel: [ 5449.844606] Add. Sense: No additional sense information
Apr 17 07:47:06 debian kernel: [ 5449.844612] sd 2:0:0:0: [sdb] CDB:
Apr 17 07:47:06 debian kernel: [ 5449.844617] ATA command pass through(12)/Blank: a1 06 20 00 00 00 00 00 00 e5 00 00
Apr 17 07:47:35 debian kernel: [ 5479.115234] mmc0: card b368 removed
Apr 17 07:47:35 debian kernel: [ 5479.116820] sdhci-pci 0000:06:01.1: Will use DMA mode even though HW doesn't fully claim to support it.
Apr 17 07:47:42 debian kernel: [ 5485.147800] usb 1-1: USB disconnect, device number 2
Apr 17 08:17:01 debian CRON[5785]: (root) CMD (   cd / && run-parts --report /etc/cron.hourly)
Apr 17 08:43:54 debian rsyslogd: [origin software="rsyslogd" swVersion="8.4.2" x-pid="899" x-info="http://www.rsyslog.com"] start
Apr 17 08:43:54 debian kernel: [    0.000000] Initializing cgroup subsys cpuset
Apr 17 08:43:54 debian kernel: [    0.000000] Initializing cgroup subsys cpu
Apr 17 08:43:54 debian kernel: [    0.000000] Initializing cgroup subsys cpuacct
Apr 17 08:43:54 debian kernel: [    0.000000] Linux version 3.16.0-4-686-pae (debian-kernel@lists.debian.org) (gcc version 4.8.4 (Debian 4.8.4-1) ) #1 SMP Debian 3.16.39-1+deb8u2 (2017-03-07)


паника случилась после того как была вытащена карта из картридера, но не сразу, прошло много времени.
мессаги про hardware error и passthrough я гуглил - это глюк udisks2, происходит только если подключена карта или usb hdd, udisks2 посылает команду каждые несколько минут, которую эти девайсы не поддерживают.если их не подключать, этой ошибки нет. hdd selftests и memtest я делал, ошибок нет. Пару раз ноут зависал без паники) первый раз с заикающейся музыкой, второй раз с цветастым мусором на экране в то время, когда работал xscreensaver/карусель. Да, когда зависло на фаерфоксе, было открыто много вкладок, процессор был загружен и (я думаю) писалось в своп.


Sergei_Alekseev

Цитата: qupl от 17 апреля 2017, 13:58:13Перегрев CPU?

Не. Сенсоры выдают 4* в покое и 5* под нагрузкой, корпус ноута абсолютно холодный, я недавно менял процессор, там новая паста и всё продуто. Паника была также и со старым одноядерным процессором.

yoric

Ну в общем трясите железо, похоже что-то нагибается. В логах тишина, что бывает при внезапном зависе. Может, шлейф какой недовставленный, или проц, может трещина в плате (понадавливайте в разных местах слегка), или тогда уж полупроводник какой-то чахнет. Кстати, мемтест сколько циклов проходил? Надо бы побольше, на ночь оставьте. И графику потестируйте.

Sergei_Alekseev

Цитата: yoric от 17 апреля 2017, 15:46:30Кстати, мемтест сколько циклов проходил? Надо бы побольше, на ночь оставьте. И графику потестируйте.
Не помню сколько, это было некоторое время назад, ещё был монитор на месте. Сейчас не могу сделать, изображение начинает выводится на внешний монитор, когда диск чекается, то есть прямо перед загрузкой de. Если переключить на внешний монитор клавиатурой во время поста, то ничего не загружается, ни груб, ни флэшки, ни лайвсиди - черный экран без активности hdd.
Как графику потестить? Кстати, вот такую петрушку обнаружил только что:
Открыть содержимое (спойлер)



[свернуть]
Может это быть причиной? Селфтесты проходит по-прежнему без ошибок.

ecc83

Смотрите шлейф, которым подключен жёсткий диск.

yoric

Какой мемтест имеете ввиду? Я про memtest86
  • , который грузится до/без ОС с флешки или диска.
    Графику потестить игрушками, ну или под винду какие-то тесты есть, не помню какие.
    А что за селфтесты, которые без ошибок?

Sergei_Alekseev

Цитата: ecc83 от 17 апреля 2017, 16:30:03Смотрите шлейф, которым подключен жёсткий диск.
Там нет шлейфа, hdd вдвигается в спаренный разъем на плате.

Цитата: yoric от 17 апреля 2017, 17:04:05Какой мемтест имеете ввиду? Я про memtest86

    , который грузится до/без ОС с флешки или диска.


Графику потестить игрушками, ну или под винду какие-то тесты есть, не помню какие.
А что за селфтесты, которые без ошибок?
И я про него) Не могу я его запустить, нет изображения на внешнем мониторе или ничего не загружается. Я же писал.
Игрушки, у меня тут есть frogatto, metal slug3, cavestory и куча эмуляторов консолей, играется без проблем, без паники :D  Ну, я не буду много часов играть, это сумасшествие. А венды здесь нет.
Селфтесты HDD, можно запустить в smartctl или GSmartControl (это gui для smartctl).

ogost

Firmware-linux-free и non-free, драйвера на всё железо разумеется поставлены?

ecc83

Цитата: Sergei_Alekseev от 17 апреля 2017, 17:18:06
Цитата: ecc83 от 17 апреля 2017, 16:30:03Смотрите шлейф, которым подключен жёсткий диск.
Там нет шлейфа, hdd вдвигается в спаренный разъем на плате.

Не обратил внимание, что у вас ноут. У вас ошибки SMART, это значит что есть проблемы или с диском, или с контроллером.
Диск можно заменить, контроллер только с материнской платой...

На всякий случай посмотрите на предмет качественного контакта диска в разъёме. Я так понял ноут не молодой уже? Возможно диск умирает.

Sergei_Alekseev

Цитата: ogost от 17 апреля 2017, 17:48:03Firmware-linux-free и non-free, драйвера на всё железо разумеется поставлены?
да. для нвидии стоит nouveau, нонфри не встают, не блэклистится nouveau. не думаю, что это проблема.


Цитата: ecc83 от 17 апреля 2017, 18:43:31У вас ошибки SMART, это значит что есть проблемы или с диском, или с контроллером.
Диск можно заменить, контроллер только с материнской платой...

На всякий случай посмотрите на предмет качественного контакта диска в разъёме. Я так понял ноут не молодой уже? Возможно диск умирает.
Я передернул диск несколько раз. Ноут старый, да, калека. Но диск менялся. Если проблемы с диском, почему селфтесты проходят без ошибок? Только что закончил гонять три часа утилу crashme, всё стабильно как часы. Есть вариант, что это просто сам по себе кернел глючит с этим железом?

ecc83

Цитата: Sergei_Alekseev от 17 апреля 2017, 19:54:54
Если проблемы с диском, почему селфтесты проходят без ошибок?

Поверьте, аппаратные неисправности могут вылазить самыми загадочными и нелогичными глюками.
Я вовсе не хочу убедить вас, что проблемы с диском. Просто в вашем скриншоте масса ошибок SMART, а значит что устройство ввода/вывода неисправно.
И это вовсе не обязательно, что сам диск неисправен. Например неисправный блок питания, который не обеспечивает необходимых напряжений, может очень долго портить настроение владельцу. Потому что глючить начинает всё :)

Sergei_Alekseev

Цитата: ecc83 от 17 апреля 2017, 20:11:37Просто в вашем скриншоте масса ошибок SMART,
Да, масса, но ошибки старые. Я сейчас посмотрел, последняя ошибка была больше 1000 часов назад.