Frozen Fido : RU.UNIX.BSD : Проблемы со SCSI-контроллером

ru.unix.bsd

 
 - RU.UNIX.BSD ------------------------------------------------------------------
 From : Vladimir Melnik                      2:5020/400     12 Sep 2007  13:26:17
 To : All
 Subject : Проблемы со SCSI-контроллером
 --------------------------------------------------------------------------------

 Здравствуйте!
 
 Есть, значить, PCI-SCSI-адаптер, который детектится следующим образом:
 | Sep 11 18:12:59 fileserver kernel: mpt0: <LSILogic 1030 Ultra4 Adapter> port
 0x4000-0x40ff mem 0xdc120000-0xdc13ffff,0xdc100000-0xdc11ffff irq 18 at device
 3.0
 on pci3
 | Sep 11 18:12:59 fileserver kernel: mpt0: [GIANT-LOCKED]
 | Sep 11 18:12:59 fileserver kernel: mpt0: MPI Version=1.2.14.0
 
 К нему пристёгнут внешний рейд на 16 огромных дисков, которые объединены
 в RAID5:
 | Sep 11 18:12:59 fileserver kernel: da0 at mpt0 bus 0 target 0 lun 0
 | Sep 11 18:12:59 fileserver kernel: da0: <ETIUSA__ S320 2.1.> Fixed Direct
 Access SCSI-4 device
 | Sep 11 18:12:59 fileserver kernel: da0: 320.000MB/s transfers (160.000MHz,
 offset 127, 16bit), Tagged Queueing Enabled
 | Sep 11 18:12:59 fileserver kernel: da0: 10726560MB (2745999360 4096 byte
 sectors: 255H 63S/T 170930C)
 
 Система загрузилась, всё хорошо. Идёт обмен данными с рейдом, никаких
 проблем не возникает, всё работает как часы.
 
 Через несколько часов, как правило, начинается мистика:
 | Sep 11 14:35:43 fileserver kernel: mpt0: request 0xc4bd8520:29128 timed out
 for ccb 0xc4c81400 (req->ccb 0xc4c81400)
 | Sep 11 14:35:43 fileserver kernel: mpt0: attempting to abort req
 0xc4bd8520:29128 function 0
 | Sep 11 14:35:44 fileserver kernel: mpt0: mpt_wait_req(1) timed out
 | Sep 11 14:35:44 fileserver kernel: mpt0: mpt_recover_commands: abort
 timed-out. Resetting controller
 | Sep 11 14:35:44 fileserver kernel: mpt0: mpt_cam_event: 0x0
 | Sep 11 14:35:44 fileserver kernel: mpt0: completing timedout/aborted req
 0xc4bd8520:29128
   [...]
 
 При этом всё кое-как ещё работает, хотя некоторые операции с дисками
 фейлятся. Мистика продолжается несколько часов, а затем переходит в
 новую фазу:
 | Sep 11 16:21:44 fileserver kernel:
 g_vfs_done():da0p1[READ(offset=7478229615307124736, length=16384)]error = 5
 | Sep 11 16:21:44 fileserver kernel:
 g_vfs_done():da0p1[READ(offset=-973258693292060672, length=16384)]error = 5
 | Sep 11 16:21:44 fileserver kernel:
 g_vfs_done():da0p1[READ(offset=-7459667419848077312, length=16384)]error = 5
 | Sep 11 16:21:44 fileserver kernel:
 g_vfs_done():da0p1[READ(offset=-612853629020008448, length=16384)]error = 5
 | Sep 11 16:21:44 fileserver kernel:
 g_vfs_done():da0p1[READ(offset=-6915798809834815488, length=16384)]error = 5
   [...]
 
 Это продолжается буквально несколько секунд, после чего система уходит в
 кернел паник и ребутится.
 
 Внешний RAID-контроллер вне подозрений, его уже меняли, притом, не раз.
 
 PCI-SCSI-адаптер тоже, вроде, целый, потому как он вполне хорошо работал
 до этого на другой машине, хотя и под управлением Windows 2003 Server.
 
 Что бы это могло быть, как кто думает? Проблема драйвера?
 
 -- 
 V.Melnik
 
 --- ifmail v.2.15dev5.4
  * Origin: Uplink, ISP (2:5020/400)

Вернуться к списку тем, сортированных по: возрастание даты уменьшение даты тема автор

Тема:	Автор:	Дата:
Проблемы со SCSI-контроллером	Vladimir Melnik	12 Sep 2007 13:26:17
Проблемы со SCSI-контроллером	Vassily Kiryanov	12 Sep 2007 16:38:31
Re: Пpоблемы со SCSI-контpоллеpом	Dmitry Zubov	14 Sep 2007 10:31:54

Архивное /ru.unix.bsd/445341a5580c7.html, оценка 3 из 5, голосов 10