зависают сервисы на CDS

доброго времени суток … прошу помочь…
настроены на CDS 11.0 сервисы Jabber, DHCP, SAMBA, Apache, DNS, SSH и другие, за последнюю неделю начало творится что-то ужасное, работает всё, отменно и без нареканий, после пяти часов все уходят домой рабочий день заканчивается, а утром ни один сервис не работает . при попытке залогиниться с самого сервера выдает такое сообщение INIT id “с1” respawning too fast: disabled for 5 minutes, помогает только перезагрузка , но только до следующего утра а потом снова перезагрузка и снова всё работает , и в итоге уже перестал выдавать какие либо сообщения и тупо не дает залогинится . на Ctrl Alt Del отвечает INIT: cannot execute /sbin/shutdown/
в общем описать проблему сложно симптомы поверхностные…

в чем может быть проблема??

Ядро пересобирали? И может еще какие модификации относительно стандартной системы производились?

Во первых - ЛОГИ
Во вторых, порою бывает, что логи не пишутся просто потому, что хард отвалился, в этом случае:
Вечером, перед уходом, подключитесь с другой машины по ssh, можно еще и screen открыть.
С утра, что бы ни случилось, скорее всего сессия не отвалится, и вы сможете выполнить dmesg

Yuri Blohin wrote:

Ядро пересобирали? И может еще какие модификации относительно стандартной системы производились?

нет не персобирал все работало . ну а если все работает зачем трогать таков был девиз в течении долгого времени

Михаил Гагауз wrote:

Во первых - ЛОГИ
Во вторых, порою бывает, что логи не пишутся просто потому, что хард отвалился, в этом случае:
Вечером, перед уходом, подключитесь с другой машины по ssh, можно еще и screen открыть.
С утра, что бы ни случилось, скорее всего сессия не отвалится, и вы сможете выполнить dmesg

спасибо , завтра попроую оставить , послезавтра отпишусь

bekzat Zhetibayev wrote:

Михаил Гагауз wrote:

Во первых - ЛОГИ
Во вторых, порою бывает, что логи не пишутся просто потому, что хард отвалился, в этом случае:
Вечером, перед уходом, подключитесь с другой машины по ssh, можно еще и screen открыть.
С утра, что бы ни случилось, скорее всего сессия не отвалится, и вы сможете выполнить dmesg

спасибо , завтра попроую оставить , послезавтра отпишусь

вот получил долгожданный dmesg

dmesg.log (19.5 KB)

удалось выяснить кое что еще

зависает он при копировании с одного диска на другой , то есть отрабатывает скрипт бекапа ночью и при копировании сразу виснет , так же при просто копирования с диска на диск большого файла виснет …

С диском я таки угадал )))

Но стоит разобраться что именно “ломается”.
Основные кандидаты:

  • хард
  • шлейф
  • питание
  • мать(под нагрузкой глючит южник)

Проверьте smart , осмотрите хард, у меня подобное было от перегрева харда (Hitachi и WD) этим страдали. От сильного перегрева на микрухах харда порою коричневатый проступает.

Шлейф - оцените визуально. Sata коннекторы не “растянулись”? Постарайтесь поменять на новый хороший (литой, не клепаный).

Также осмотрите БП на предмет вздутых кондеров. Проблема может быть если БП под нагрузкой колбасит.

Осмотрите мать. Тоже на предмет вздутых кондеров.

PS

Блин, сразу как-то не подумал.
Устройте “рокировку”.
Подключите хард в другой мощный комп (надеюсь ядро строго под эту мать не затачивали) и запустите создание бэкапа. Если все пройдет нормально - хард живой, ищите проблемы в остальном железе. Если опять глюканет - меняйте хард.

Перед перносом харда - сделайте слудующее

 # mv /etc/udev/rules.d/70-persistent-net.rules{,_backup}

2 Михаил Гагауз

спасибо за дельные советы, в обед попробую и шлейфы поменять и на другом железе запустить создание бекапа, позже отпишусь