Comments | amarao_san: (без темы)

amarao_san

(Untitled)

Sep 26, 2012 17:15

Собственно, описание Великого Пиздеца: http://habrahabr.ru/company/selectel/blog/152351/

Comments 23

metaclass September 26 2012, 15:05:27 UTC

А что вообще положено делать вам и вашим клиентам для того чтобы не убить данные в таком случае? Даунтайм понятно - это минус чуть-чуть упущенной прибыли, одноразово, форс-мажоры бывают, компенсировали, забыли.

Но "убились нахрен все данные клиентов" - это же печаль какая-то совсем. Ладно, предположим клиенты (наученные) делают бэкап себе, а с вашей стороны хоть какая-то техническая возможность избежать хотя бы повреждения FS есть?

amarao_san September 26 2012, 16:19:07 UTC

С точки зрения виртуалок это всё было как "отключили по питанию".

А "потеря данных"... Я лично наблюдал клиента, который пытался убедить fsck сделать проверку для PV-тома на LVM. Такому ума хватит метаданные ext3 поверх метаданных LVM накатать.

metaclass September 26 2012, 17:06:49 UTC

Т.е. журнализация в файловых системах таки работает нормально, в смысле что они переживают отключение питания как положено, не умирая?

Просто я удолбался выяснять аналогичный вопрос про базы данных. По любой логике сбой питания - такая же проблема, как и все остальные, и соответственно транзакции после commit должны быть на диске и после включения их изменения будет видно.
Но на практике возникают разнообразные вопросы вида "а рейд-контроллер ли у вас с батарейкой", "без UPS базы регулярно дохнут", т.е. практически базы данных не всегда переживают издевательство с выключением машин.

amarao_san September 26 2012, 17:55:05 UTC

Ключевое: write cache. Отсюда требование батарейки. Если нет батарейки и есть write cache - то при фейле всего и вся теряется не только current state, но и некий произвольный кусок предыдущих. Не факт, что консистентый с точки зрения БД.

У нас потому SSD (RAID10 over SSD) для кеширования на запись и используется, чтобы в случае эпикфейла всего лишь продолжнить работу.

Thread 8

inkelyad September 26 2012, 16:12:22 UTC

Перевод в каком-нибудь англоязычном ресурсе будет?

amarao_san September 26 2012, 16:17:49 UTC

Нет. У нас 99% клиентов понимают по-русски.

inkelyad September 26 2012, 16:23:04 UTC

Так не для клиентов же. А для учебников.

(The comment has been removed)

Thread 5

ext_458427 September 26 2012, 16:34:47 UTC

ад какойта ваще. как в анекдоте про бекапы: если люди, у которых нет резервного оборудования и сингле поенте оф фейлуре, а есть люди, которые думают, что у них есть резерф и все задублировано.

amarao_san September 26 2012, 17:46:11 UTC

трасса была зарезервирована. По поводу резерва коммутатора - там было виртуальное шасси (т.е. кластер), которое из нескольких железок. Легло синхронно.

ext_458427 September 27 2012, 07:00:49 UTC

вот я и не понял, что помешает этому кластеру лечь синхронно еще раз.

окей, если трансиверы (или как они там) опять сдохнут, то вы их быстро замените, пользуясь наработанным опытом, но если опять произойдет что-то нештатное - все равно будуте тыкаться вслепую, ребутать и читать логи по два часа, что не гуд.

amarao_san September 27 2012, 10:25:08 UTC

Ваши варианты?

ufm September 26 2012, 18:43:46 UTC

"Респект и уважуха", как принято говорить, за подробный рассказ что именно произошло. Познавательно.

P.S. Но вот зарекаться от отказов даже в новой супер-пупер СХД я не стал. Всякое бывает. Например отключение на секунду питания по всему ДЦ при переходе с одного ИБП на другой. Внезапно.

amarao_san September 26 2012, 19:01:01 UTC

Давайте начнём с более простого: инженер перепутает шкаф и рубанёт стойку по обоим вводам.

Да, может быть. Я же говорю про конкретные мерзкие баги, которые я умудрился найти практически в каждой железке (драйвере) и даже в linux-raid (аж три дедлока).

easyjohn September 27 2012, 17:50:35 UTC

а вот расскажи, как ты их находил, меня сам процесс поиска всегда тоже интересовал.

amarao_san September 27 2012, 18:36:29 UTC

За исключением нескольких мелких багов, появившихся в тесте, процесс поиска начинался с письма с заголовком "** PROBLEM ( ... )

Thread 7