мыши плакали, кололись, но продолжали есть кактус

Mar 12, 2013 11:08

возвращаясь к напечатанному - мои любимые Кумары в Royal Bank of Scotland, проебамши 200 миллионов баксов, очередной раз уронили систему, выдав в качестве объяснений невнятное "начальникама, мэйнфреймама сломалася".

так вот. мэйнфренма сломатьсяма может только в случае, если ее ломать специально. конфигурация делается не дятлами из интеграторов, а бородатыми WASP из IBM на заводе. помимо задублированности всего, что только можно (мэйнфрейму пофигу на отказы чего угодно, вплоть до процессоров), секрет надежности мэйнфрейма - Parallel Sysplex. в общем-то, это основная причина, по которой мэйнфреймы и покупают. Sysplex имеет существенное отличие от характерной для всего остального HA-схемы "упал-отжался" (standby-active). там нет необходимости делать узел активным, прокатывать redo-логи etc. два или более мэйнфрейма в Sysplex, разнесенные географически, работают в single system image, динамически распределяя нагрузку между машинами, как будто бы это один сервер. в случае падения любой из машин, диспетчер, не получив результат исполнения на оной, перенаправляет исполнение на другие процессора других машин.

для наглядности:

(здесь была картинка, но пидарасы из imageshack заменили ее на рекламу)

то есть, чтобы мэйнфрейм упал, нужно выполнить два условия:

1) выключить машину из Sysplex,
2) подождать N лет, пока в ней не сломается всё по кругу.

вывод: одна из черепашек пиздит. испугамшись общественного резонанса, который случился по поводу ручного убиения CA-7 в прошлый раз, Kumar-addicted management начинает изобретать небылицы.

One source told The Reg: “This one looks like a standard outage, rather than anything more complicated. It's just so unusual for these to happen with mainframes.”

пруф http://www.theregister.co.uk/2013/03/07/rbs_natwest_hardware_outage/

UPD: краткий словарик, для непосвященных:

Coupling Facility - выделенный логический раздел (LPAR) на мэйнфрейме, с одним или более процессоров. сниффит память реплицируемых разделов через механизм DMA (напомню, в z, p, и i-series все адреса транслируются через гипервизор), и передает содержимое "тому парню" (другим мэйнфреймам, объединенным в Sysplex).

CEC - Central Electronic Complex - сервер/мэйнфрейм, включает в себя процессоры, память, системные диски, таймеры, ввод-вывод. сервер, короче.

FICON - версия протокола Fiber Channel для мэйнфреймов.

DASD - Direct Attached SCSI Device

PPRC - протокол репликации Peer-to-Peer Remote Mirror, IBM переименовала его в Metro Mirror.

fail

Previous post Next post
Up