Стационарный (используется в качестве сервера) CSS с батареей APC.
Ноутбук CLD.
Мир везде постоянно обновляется. На стационарном установлен пакет apcupsd для управления батареей. Заметил очень неприятную особенность, при пропадании и последующем появлении питания (зачастили с отключением света в доме, в среднем пару раз в неделю) на обоих компьютерах невозможно работать. На ноуте подвисает рабочий стол, на стационарном завершаются большенство необходимых программ, в том числе и sshd, остаются только некоторое количество каких-то системных. На ноуте иногда (но не всегда) лечится убиванием процесса upowerd, на стационарном все гораздо хуже, его приходится просто перегружать.
Может у кого есть решение данной проблемы? Или куда посоветуете покопать?
А то наличие батареи совершенно не добавляет автономности.
P.S. Некоторое время назад (около 2-х месяцев) все работало нормально и никаких действий для этого не предпринималось.
Провел некоторое расследование, Похоже что корни данной проблемы на компьютерах разные.
Вот выдержка из лога на сервере
2013-02-12T09:17:09.858396+04:00 srv1 kernel: r8169 0000:04:00.0: eth0: link down
2013-02-12T09:17:10.033939+04:00 srv1 apcupsd[3003]: Power failure.
2013-02-12T09:17:11.035165+04:00 srv1 ifplugd(eth0)[2528]: Link beat lost.
2013-02-12T09:17:15.557675+04:00 srv1 apcupsd[3003]: Running on UPS batteries.
2013-02-12T09:17:16.251670+04:00 srv1 wall[24792]: wall: user root broadcasted 1 lines (50 chars)
2013-02-12T09:17:17.160616+04:00 srv1 ifplugd(eth0)[2528]: Executing '/etc/ifplugd/ifplugd.action eth0 down'.
2013-02-12T09:17:18.922949+04:00 srv1 ifplugd(eth0)[2528]: client: /etc/init.d/net.eth0: line 742: is_ppp: команда не найдена
2013-02-12T09:17:19.010545+04:00 srv1 ifplugd(eth0)[2528]: Program executed successfully.
2013-02-12T09:17:28.386030+04:00 srv1 apcupsd[3003]: Mains returned. No longer on UPS batteries.
2013-02-12T09:17:28.386173+04:00 srv1 apcupsd[3003]: Power is back. UPS running on mains.
2013-02-12T09:17:28.979801+04:00 srv1 wall[25007]: wall: user root broadcasted 1 lines (35 chars)
2013-02-12T09:17:29.138418+04:00 srv1 kernel: r8169 0000:04:00.0: eth0: link up
2013-02-12T09:17:30.021616+04:00 srv1 ifplugd(eth0)[2528]: Link beat detected.
2013-02-12T09:17:31.122787+04:00 srv1 ifplugd(eth0)[2528]: Executing '/etc/ifplugd/ifplugd.action eth0 up'.
2013-02-12T09:17:40.948603+04:00 srv1 /etc/init.d/net.eth0[25108]: start-stop-daemon: failed to start `/bin/busybox'
2013-02-12T09:17:40.948727+04:00 srv1 ifplugd(eth0)[2528]: client: * start-stop-daemon: failed to start `/bin/busybox'
2013-02-12T09:17:40.953181+04:00 srv1 /etc/init.d/net.eth0[25011]: ERROR: net.eth0 failed to start
2013-02-12T09:17:40.953256+04:00 srv1 ifplugd(eth0)[2528]: client: * ERROR: net.eth0 failed to start
2013-02-12T09:17:41.053742+04:00 srv1 ifplugd(eth0)[2528]: Program executed successfully.
Как я понял из этих сообщений сначала пропадает сеть (роутер к бесперебойнику не подключен). затем после появления питания она не может стартовать, и следовательно отваливаются все приложенияи использующие отвалившийся интерфейс. Что можно сделать чтобы сеть все же стартовала?
А зачем apcupsd у вас есть APC-шный упс?
Мониторить состояние батареи можно и по /sys/class/power_supply/BAT* хоть по крону, хоть свой демон с чем-то вроде while sleep 10; do sh ./check_bat.sh; done
Если вы все-же хотите использовать демон apcupsd, то тут уже вам надо изучать конфиги, и настраивать его под свои нужды.
Уверен, что если поискать, в сети много документации и примеров по его настройке найти можно.
Да упс APCшный. Дело не в мониторинге, я привел логи на момент отключения, там видно что неподнимается сетевой интерфейс, и из-за него отваливаются необходимое программы.
извиняюсь, моя невнимательность, я понял, что есть два ноута, один в качестве сервера, и его батарею вы мониторите через apcupsd.
2013-02-12T09:17:11.035165+04:00 srv1 ifplugd(eth0)[2528]: Link beat lost.
давайте угадаю - свитч на упс-е не стоит? или wifi-точка, если ноут в сети через него?
Если это так, то:
# запитайте сетевое оборудование с того-же УПС-а, время автономной работы сильно не уменьшится, а вот проблем с отваливающейся сетью не будет
# пропишите строку modules="!plug" в /etc/conf.d/net
PS
Дело не в мониторинге, я привел логи на момент отключения, там видно что не поднимается сетевой интерфейс, и из-за него отваливаются необходимое программы.
2013-02-12T09:17:40.948727+04:00 srv1 ifplugd(eth0)[2528]: client: * start-stop-daemon: failed to start `/bin/busybox’
Куда прописать приведенную вами строку?
К УПСе подключится не получится, там нет разъемов для простой вилки, прийдется перепаивать провод, но навреное это самый подходящий вариант. Как я понимаю без этого (включения роутера через УПСу) проблему не решить, т.к. при отваливании питания роутера интерфейс всеравно будет падать и все проги будут падать.
Разъем у меня такой, но я не зря писал про роутер, а не свитч. У роутера простой импульсный БП на конце провода, тут остается только мудрить с розеткой…
Не знаю насчет вашего роутера
по поводу отваливающихся служб - я написал
серверу прописываете IP статикой, и выключаете все plug
причины по которым, имхо, вам надо рутер/свитч тоже от УПС-а запитать - я тоже описал.
А дальше уже ваше дело прислушиватья к совету или говорить почему это неудобно(или не нужно)
Кстати, у вас роутер что делает? dhcp раздает? почему не сервер?