|
|
ru.unix.bsd- RU.UNIX.BSD ------------------------------------------------------------------ From : Vladimir Melnik 2:5020/400 12 Sep 2007 13:26:17 To : All Subject : Проблемы со SCSI-контроллером -------------------------------------------------------------------------------- Здравствуйте! Есть, значить, PCI-SCSI-адаптер, который детектится следующим образом: | Sep 11 18:12:59 fileserver kernel: mpt0: <LSILogic 1030 Ultra4 Adapter> port 0x4000-0x40ff mem 0xdc120000-0xdc13ffff,0xdc100000-0xdc11ffff irq 18 at device 3.0 on pci3 | Sep 11 18:12:59 fileserver kernel: mpt0: [GIANT-LOCKED] | Sep 11 18:12:59 fileserver kernel: mpt0: MPI Version=1.2.14.0 К нему пристёгнут внешний рейд на 16 огромных дисков, которые объединены в RAID5: | Sep 11 18:12:59 fileserver kernel: da0 at mpt0 bus 0 target 0 lun 0 | Sep 11 18:12:59 fileserver kernel: da0: <ETIUSA__ S320 2.1.> Fixed Direct Access SCSI-4 device | Sep 11 18:12:59 fileserver kernel: da0: 320.000MB/s transfers (160.000MHz, offset 127, 16bit), Tagged Queueing Enabled | Sep 11 18:12:59 fileserver kernel: da0: 10726560MB (2745999360 4096 byte sectors: 255H 63S/T 170930C) Система загрузилась, всё хорошо. Идёт обмен данными с рейдом, никаких проблем не возникает, всё работает как часы. Через несколько часов, как правило, начинается мистика: | Sep 11 14:35:43 fileserver kernel: mpt0: request 0xc4bd8520:29128 timed out for ccb 0xc4c81400 (req->ccb 0xc4c81400) | Sep 11 14:35:43 fileserver kernel: mpt0: attempting to abort req 0xc4bd8520:29128 function 0 | Sep 11 14:35:44 fileserver kernel: mpt0: mpt_wait_req(1) timed out | Sep 11 14:35:44 fileserver kernel: mpt0: mpt_recover_commands: abort timed-out. Resetting controller | Sep 11 14:35:44 fileserver kernel: mpt0: mpt_cam_event: 0x0 | Sep 11 14:35:44 fileserver kernel: mpt0: completing timedout/aborted req 0xc4bd8520:29128 [...] При этом всё кое-как ещё работает, хотя некоторые операции с дисками фейлятся. Мистика продолжается несколько часов, а затем переходит в новую фазу: | Sep 11 16:21:44 fileserver kernel: g_vfs_done():da0p1[READ(offset=7478229615307124736, length=16384)]error = 5 | Sep 11 16:21:44 fileserver kernel: g_vfs_done():da0p1[READ(offset=-973258693292060672, length=16384)]error = 5 | Sep 11 16:21:44 fileserver kernel: g_vfs_done():da0p1[READ(offset=-7459667419848077312, length=16384)]error = 5 | Sep 11 16:21:44 fileserver kernel: g_vfs_done():da0p1[READ(offset=-612853629020008448, length=16384)]error = 5 | Sep 11 16:21:44 fileserver kernel: g_vfs_done():da0p1[READ(offset=-6915798809834815488, length=16384)]error = 5 [...] Это продолжается буквально несколько секунд, после чего система уходит в кернел паник и ребутится. Внешний RAID-контроллер вне подозрений, его уже меняли, притом, не раз. PCI-SCSI-адаптер тоже, вроде, целый, потому как он вполне хорошо работал до этого на другой машине, хотя и под управлением Windows 2003 Server. Что бы это могло быть, как кто думает? Проблема драйвера? -- V.Melnik --- ifmail v.2.15dev5.4 * Origin: Uplink, ISP (2:5020/400) Вернуться к списку тем, сортированных по: возрастание даты уменьшение даты тема автор
Архивное /ru.unix.bsd/445341a5580c7.html, оценка из 5, голосов 10
|