Cisco тоже не торт: klink0v

klink0v

Cisco тоже не торт

Apr 07, 2022 17:41

Вот здесь я распинался о том, почему Cisco лучше чем Juniper. Сейчас я чё-то засомневался. Точнее даже не совсем так. Шо то фигня, шо это фигня. ©

Работал-работал у нас в одной стойке (rack) кластер из двух коммутаторов Cisco 9200L. Его никто никогда не трогал, особых проблем не доставлял. А потом начал без предупреждения творить странные вещи.

В непредсказуемый момент он берет и полностью прекращает передачу данных через себя. Пишет в логах что-то типа
%IOSXE_INFRA-6-PROCPATH_CLIENT_HOG: IOS shim client 'ngwc fed bipc' has taken 11352 msec (runtime: 0 msec) to process a 'unknown' message

и "адьес амигос". Просто "затыкает" все порты. На графике проходящего трафика это выглядит примерно так.

Несколько секунд тупит, потом продолжает работать. Но эти провалы успевают заметить и Zabbix, и базы данных. Чаще TCP-сессии всё таки не рвутся, но приятного в любом случае мало.

По пакетам в секунду там выходит что-то из серии 30 kpps на порт. Вроде не супер много. Но в любом случае, что это за коммутатор на**й, который вообще не держит нагрузку? Тем более, что прямо сейчас к нему подключено вообще только восемь (!) серверов.

На ресурсах цЫски удалось найти только вот это: раз, два. Насколько я понимаю, баг не новый, но его так и не пофиксили.

В общем, в очередной раз неведомая ***ная ***ня творится. Что с этим делать, опять непонятно. Только решили одну проблему с железом, и вот на тебе следующую. Мать-мать-мать, в природе вообще существует нормальное стабильно работающее железо?

cisco, обзор, железо, сети, баги