Об обратной связи

Oct 25, 2023 11:22


Слово «положительный» обычно означает «хороший», а «отрицательный» - плохой. Но инженеры, занимающиеся надёжностью систем, со мной не согласятся, потому что нет ничего хуже системы с положительной обратной связью.
Подумалось это в связи с вопросом, который задал мне коллега: почему аварийное переключение в системе «Ы» выполняется настолько дольше, чем в системе «Ъ»?
Для тех, кто далёк от ИТ, расскажу, что такое отказоустойчивый кластер. Есть база данных (не обязательно она, но в данном случае таки да), которая функционирует и обрабатывает пользовательскую нагрузку. Рядом стоит ещё одна точно такая же (т. н. standby), которая постоянно синхронизируется с основной и ждёт, пока та свалится, чтобы принять нагрузку на себя. А рядом с этой конструкцией - наблюдатель (clusterware), который следит за состоянием обеих баз и в случае аварии принимает решение о переключении.
Ошибаться свойственно не только человеку, но и машине. Поэтому у наблюдателя есть некоторая задержка: резервная база вводится в строй не сразу же, а через некоторое время после обнаружения аварии.
Рассмотрим систему «Ы». Пусть время запуска нового Ыкземпляра - 10 минут, и если наблюдатель пример решение переключаться, когда никакой аварии на самом деле нет, мы на ровном месте потеряем 10 минут. Поэтому выставляем задержку... ну, скажем три минуты.
Рассмотрим теперь систему «Ъ». Время запуска Ъкземпляра - пять минут, поэтому достаточно задержки... ну, допустим, в 30 секунд.
Таким образом Ъкземпляр запускается вдвое быстрее, чем Ыкземпляр. А Ы-кластер переключается почти втрое дольше, потому что более медленное переключение заставляет нас до последнего надеяться, что никакой аварии на самом деле не произошло, увеличивая задержку. Вот так и проявляется положительная обратная связь.

ЭВМ, русский язык

Previous post Next post
Up