Jul 14, 2012 02:19
Он работает, пока мы спим...
4:41 - сервер перестает отвечать на пинг, система мониторинга создает тикет
4:44 - админ говорит что разбирается с проблемой
4:55 - мониторинг сообщает что сервер снова в строю
4:56 - админ рапортует что на сервере произошел kernel panic, сервер был перезагружен, прикрепляет к сообщению пруфпик и закрывает тикет. (пруфпик - фотка с монитором подключенным к серверу, на мониторе отображается kernel panic :D ).
9:00 - будильник, подъем, почта, ухтыбля!
Итого ~20мин c учетом времени необходимого на детект проблемы. Первый "серьезный" даунтайм за 4,5 года. Респект ребятам!