Вот про диагностику

Jun 21, 2016 00:43

в идеале диагностика и правда не нужна, это излишняя и абсолютно непродуктивная операция потребность в которой вызвана неоптимальной конструкцией и непродуманным подходом к ремонту, снабжению запчастями и т.п.. Ломая голову над проблемой три часа или три дня человек не производит ровным счетом ничего полезного. Всякая система должна быть сделана ( Read more... )

Leave a comment

zlokk June 21 2016, 02:09:35 UTC
Факапнулс сервак - быстрый диагноз - деталь нахер по гарантии улетала и втыкалась новая. Вся диагностика - 5 минут чтения логов. Если сложная ситуация - на новый сервак бэк сливался и поехали дальше, процесс за час перезапущен. А старую платформу можно было в свободное время поковырять. Или закинуть производителю, чтобы он ковырял по гарантии.

хыхы) вспомнилась ситуация: два сервака, новые-гарантийные все из себя, рабочий и запасной. ставим в стойку, накатываем esx, ставим систему, тестируем, запускаем, все работает.. на следующее утро розовый экран (это как BSOD, только розовый. не в операционке, а в самом гипервизоре). переключаем на резервный сервер, разбираемся, в логах ничего криминального, включаем назад основной, все работает.. через пару дней снова розовый экран. материмся, переключаем на резервный, основной тестируем под всевозможной нагрузкой три дня - все ок. оставляем постоять еще на пару дней без нагрузки (все это время продакшн крутится на резервном серваке без каких-либо проблем) - опаньки, розовый экран.
ну понятно, скорее всего что-то в железе самого сервака, хоть и новый, но всякое бывает. оставляем крутиться продакшн на резерве, думаем как сдавать по гарантии основной.. и в этот момент розовый экран на резервном. ТАДАМММ.

Reply

darkwalker June 21 2016, 09:06:30 UTC
У девочки есть имя синьки есть код. И код обычно очень хорошо диагностит проблему которая к факапу привела.

Reply

zlokk June 21 2016, 11:07:13 UTC
ага, код был. что-то типа "отключаем нахуй процессор, потому что все скучно", вощм что-то из области энергосбережения. и рекомендация от вмвари, отключите управление acpi в биосе и/или конфиге гипервизора. естественно, хуй )

забег по вариным форумам дал еще пару таких же несчастных, одному рекомендация отключения помогла, другим так же хуй.

забегая вперед, это оказалась несовместимость конкретной версии гипервизора с конкретным поколением сервера. и поскольку и то и другое было крайне свежим, вмварь сама про это не знала.

Reply

darkwalker June 21 2016, 11:23:40 UTC
Ясн, знакомо.
У мня тут комп домашний синьку повадился выдавать несистемно но регулярно. Заебал в край. Сначала думал что железо мандит. Были причины так думать. Но выяснилось что Аваст с Виндой дрались за системный файл. Аваст его стопил и проверял, Винда возмущалась и роняла комп.

Reply

stifff June 21 2016, 10:34:02 UTC
хорошая повторяемость! )

Reply


Leave a comment

Up