Самопроизвольно отключается внешний жесткий диск

Автор gardarea51, 06 сентября 2014, 13:58:35

« назад - далее »

0 Пользователи и 1 гость просматривают эту тему.

gardarea51

Всем привет!
Есть внешний жесткий диск, WD MyPassport USB3.0. Подключен к серверу hp dl320e g8 v2 к порту usb3.0. Проблема в том, что диск видимо самопроизвольно отключается, он может проработать всю ночь, а может отключиться через 3 часа после подключения. Я не понимаю почему это происходит. Скачал для него утилиту настройки от WD, задал параметр "автосна" на "никогда", но это не помогло. Втыкал в другой порт - не помогло.

В момент ошибки - сначала I/O Error при доступе к разделу диска, а потом дичк исчезает и появляется под новым именем. Был sdc, стал sde, sdd, sdf и т.д. В логе в момент отключения появляются следующие записи:

Sep  6 12:09:01 gw kernel: [1366762.246568] usb 5-2: reset SuperSpeed USB device number 12 using xhci_hcd
Sep  6 12:09:01 gw kernel: [1366762.262763] xhci_hcd 0000:00:14.0: xHCI xhci_drop_endpoint called with disabled ep ffff880200d37b40
Sep  6 12:09:01 gw kernel: [1366762.262772] xhci_hcd 0000:00:14.0: xHCI xhci_drop_endpoint called with disabled ep ffff880200d37b80
Sep  6 12:21:04 gw kernel: [1367484.209910] usb 5-2: reset SuperSpeed USB device number 12 using xhci_hcd
Sep  6 12:21:04 gw kernel: [1367484.226017] xhci_hcd 0000:00:14.0: xHCI xhci_drop_endpoint called with disabled ep ffff880200d37b40
Sep  6 12:21:04 gw kernel: [1367484.226026] xhci_hcd 0000:00:14.0: xHCI xhci_drop_endpoint called with disabled ep ffff880200d37b80
Sep  6 12:25:27 gw kernel: [1367747.218389] usb 5-2: USB disconnect, device number 12
Sep  6 12:25:57 gw kernel: [1367777.858605] scsi 16:0:0:0: [sdc] Unhandled error code
Sep  6 12:25:57 gw kernel: [1367777.858613] scsi 16:0:0:0: [sdc]  Result: hostbyte=DID_ABORT driverbyte=DRIVER_OK
Sep  6 12:25:57 gw kernel: [1367777.858620] scsi 16:0:0:0: [sdc] CDB: Read(10): 28 00 03 d0 cb 00 00 00 f0 00
Sep  6 12:25:57 gw kernel: [1367777.858638] end_request: I/O error, dev sdc, sector 64015104
Sep  6 12:25:57 gw kernel: [1367777.860271] scsi 16:0:0:0: rejecting I/O to offline device
Sep  6 12:25:57 gw kernel: [1367777.861831] scsi 16:0:0:0: [sdc] killing request
Sep  6 12:25:57 gw kernel: [1367777.861879] scsi 16:0:0:0: [sdc] Unhandled error code
Sep  6 12:25:57 gw kernel: [1367777.861883] scsi 16:0:0:0: [sdc]  Result: hostbyte=DID_NO_CONNECT driverbyte=DRIVER_OK
Sep  6 12:25:57 gw kernel: [1367777.861889] scsi 16:0:0:0: [sdc] CDB: Read(10): 28 00 03 d0 cb f0 00 00 10 00
Sep  6 12:25:57 gw kernel: [1367777.861904] end_request: I/O error, dev sdc, sector 64015344
Sep  6 12:25:58 gw kernel: [1367778.106555] usb 5-2: new SuperSpeed USB device number 13 using xhci_hcd
Sep  6 12:25:58 gw kernel: [1367778.123328] usb 5-2: New USB device found, idVendor=1058, idProduct=074a
Sep  6 12:25:58 gw kernel: [1367778.123337] usb 5-2: New USB device strings: Mfr=1, Product=2, SerialNumber=5
Sep  6 12:25:58 gw kernel: [1367778.123342] usb 5-2: Product: My Passport 074A
Sep  6 12:25:58 gw kernel: [1367778.123346] usb 5-2: Manufacturer: Western Digital
Sep  6 12:25:58 gw kernel: [1367778.123350] usb 5-2: SerialNumber: 575832314135334D37313836
Sep  6 12:25:58 gw kernel: [1367778.124473] scsi17 : usb-storage 5-2:1.0
Sep  6 12:25:59 gw kernel: [1367779.122840] scsi 17:0:0:0: Direct-Access     WD       My Passport 074A 1025 PQ: 0 ANSI: 6
Sep  6 12:25:59 gw kernel: [1367779.123198] scsi 17:0:0:1: Enclosure         WD       SES Device       1025 PQ: 0 ANSI: 6
Sep  6 12:25:59 gw kernel: [1367779.125463] sd 17:0:0:0: Attached scsi generic sg2 type 0
Sep  6 12:25:59 gw kernel: [1367779.125622] ses 17:0:0:1: Attached Enclosure device
Sep  6 12:25:59 gw kernel: [1367779.125726] sd 17:0:0:0: [sdd] 3907024896 512-byte logical blocks: (2.00 TB/1.81 TiB)
Sep  6 12:25:59 gw kernel: [1367779.125734] ses 17:0:0:1: Attached scsi generic sg3 type 13
Sep  6 12:25:59 gw kernel: [1367779.126857] sd 17:0:0:0: [sdd] Write Protect is off
Sep  6 12:25:59 gw kernel: [1367779.126864] sd 17:0:0:0: [sdd] Mode Sense: 47 00 10 08
Sep  6 12:25:59 gw kernel: [1367779.127225] sd 17:0:0:0: [sdd] No Caching mode page found
Sep  6 12:25:59 gw kernel: [1367779.128779] sd 17:0:0:0: [sdd] Assuming drive cache: write through
Sep  6 12:25:59 gw kernel: [1367779.132077] sd 17:0:0:0: [sdd] No Caching mode page found
Sep  6 12:25:59 gw kernel: [1367779.133816] sd 17:0:0:0: [sdd] Assuming drive cache: write through
Sep  6 12:25:59 gw kernel: [1367779.454971]  sdd: sdd1
Sep  6 12:25:59 gw kernel: [1367779.456761] sd 17:0:0:0: [sdd] No Caching mode page found
Sep  6 12:25:59 gw kernel: [1367779.458326] sd 17:0:0:0: [sdd] Assuming drive cache: write through
Sep  6 12:25:59 gw kernel: [1367779.460082] sd 17:0:0:0: [sdd] Attached SCSI disk


С питанием судя по отчетам сервера проблем нет, в логах hp ilo (интерфейс управления сервером) - никаких ошибок или предупреждений. Кто-то сталкивался с подобной проблемой?

yura_n

#1
Похожие ситуации - обычное дело для переносных хардов, когда им питания не хватает (силы тока, я имею в виду). Как он у вас подключен? Только к одну порту USB? Или к двум, для усиления питания?

gardarea51

К одному, насколько я знаю - с порта usb3.0 диску ну просто обязано хватать питания. Посидел погуглил, кажется это баг в ядре. Нашел несколько багрепортов с подобными симптомами. Вот и думаю что делать.. может воткнуть диск в порт usb2.0 и посмотреть как оно будет себя вести. Конечно не хотелось бы, скорость то упадет на порядок (да и могут начаться как раз проблемы с нехваткой питания)..

ps: диск используется для сохранения бэкапов системы и данных перед тем, как они будут забраны с него по сети, бэкапы делаются в полночь, а он зараза то отвалится, то нет..

vladimir_ar

Бывает, просто плохой контакт в разъеме, да и шнурок плохой (с тонкими проводами по питанию).
Debian Testing, kernel 3.16-2-amd64, OpenBox
AMD A8-3750 / 16Gb RAM / ATI HD6550D (onboard) / Sound ASUS Xonar - DS
_______________________________
Debian Testing, kernel 3.14-2-amd64, OpenBox
HP-655 AMD E1 / 8Gb RAM / ATI HD7310M

gardarea51

#4
Шнурок надо будет попробовать поменять на проверенный.. вдруг действительно..
Но опять же при операциях бэкапа и других операциях чтения-записи - никаких ошибок в логах.. а потом бац и все..

ps: есть у меня внешний диск hp (внутри wd) на 500Гб, тоже usb3.0. Дома втыкается в 3.0, на работе в 2.0 - работает и там и там по дному шнурку как часы. Попробую еще и его воткнуть в сервер, как он себя поведет.

gardarea51

В общем работает в usb 2.0 диск в 2Tb, видать реальный баг. Пока оставил его так, все равно бэкапы делаются ночью, хотя конечно жаль..

Sergei S.

если замена кабеля не помогла есть вероятность плохого контакта гнезда (в коробке харда) и контролера.
в любых устройствах лучше лишний раз выдернуть шнурок при переносе и никогда не носить с подключиными устройствами. а розетки на мамке трогать крайне редко иначе отсохнет контакт и все ....
Извеняюсь за оф топ.
последнее время WD теряет лицо,
то проблемы с чипами,
то с прошивкой,
то с управлением питания.
было дело за полгода с боем три раза
поменял WD2000FYYZ или WD2001FYYZ непомню уж подробностей.
сейчас пересел на HITACHI и вопросы отпали.
Вывод меняй по гарантии если не закончилась.
Есть встречный вопрос
1) какие утилиты WD использовал,
на сайте для Linux нет.
2) в какую файловую систему и с какими настройками используете и какова таблица разделов.
я хочу свой WD Passport оптимизировать (поменять настройки и файловую систему NTFS нехочу).

gardarea51

Утилиты никакие не использовал, только на ноутбуке с виндой запустил какую-то их программу, чтобы выставить время отключения на "никогда". Файловая система ext4. Видимо дело все таки не в диске. На usb 2.0 работает как часы.

Sergei S.

если веревка битая или ножки разьема отломались от платы,
то он и будет работать пока контакт есть,
пошевелили и все... >:( ???
я не спец в электро части в теории потребитель usb2.0 требует меньше питания чем потребитель usb 3.0
и соответственно когда с паленого или ломаного разьема на мамке или коробке диска,
ничанают тянуть больше токов начинают искрить и греться слабые места соответствено связь может пропадать.
как возможний итог маленький винт просит меньше +3,0 больше тока.
у меня на одной мамке тоже есть негодный 2,0 (не все приборы понимает),
через него был подключен сканер и после небольших проблем с 220 (прыгало напряжнние),
тотже сканер постояно вкл выкл только на этой разетке.
-
лучше не шутите со стабильностью бэкапного диска иначе какой в нем смысл.
несите в сервис или ставте на бругие задачи.

gardarea51

Меня тоже немного смущала мысль втыкания диска 3.0 в порт 2.0. Однако, как показала практика - питания на таких портах хватает уже наверное лет 5. Сами производители матринок допускают возможность такого втыкания. По теме - это видимо баг, я гуглил - с десяток багрепортов с такой проблемой. будем ждать фикса. А диск работает и не жужжит )) бэкапы копирую с него каждый будний день )

Sergei S.

#10
все правильно устройство 3.0 при подключении в 2.0 работает как 2.0 и соответственно наоборот,
2.0 в 3.0 єто 2.0,
соответствено когда в подпаленый или сломаный разъем 3.0 вкл 2.0 проблем можем не замечать,
но при вкл 3.0 = 3.0 нагрузки увеличиваются и начинаются проблемы,
т.е есть три слабых места розетка мамки (или выносная на корпусе), веревка и розетка HDD.
если другой диск 3.0 в мамке 3.0 работает стабильно, значит проблема на стороне HDD-розетки,
несите в сервис пускай меняют или паяют.
как вариант вкл в розетку 2.0 и ждите когда отвалится окончательно.
желательно поменьше шевелить HDD и каждый раз при переноске вынимайте веревку с HDD.
кстати по вашему совету поменял файловую систему на ext4 результат удивил перемещал видео 120гб на скорости 97-68,4  :D