Bericht zum Ausfall von Nexus am 31.10.
Daniel Baumann
daniel.baumann at bfh.ch
Sun Nov 6 15:59:02 CET 2022
Hallo zusammen
Kurzfassung
===========
* am 31.10. war Infoblox (DHCP) von 13:58 bis 14:30 offline.
* am 31.10. war BEnet von 13:58 bis kurz vor 17 Uhr nicht erreichbar.
Hintergrund
===========
* Wir haben zwei Cisco Nexus-Switches im RZ in Bern an denen frueher
alle Server im Cage-B angeschlossen waren. Letzten Maerz ging ein
Nexus kaputt, vergl.:
https://lists.bfh.science/pipermail/bfh-linux-announce/2022-March/thread.html
* Der Leih-Nexus und unser eigener Nexus sind zusammen ein Paerchen
(VPC). Beim kontrollierten Abschalten zur Rueckgabe des Leih-Nexus
gab es ein Synchronisations-Problem das unseren Nexus dazu
veranlasst hat, alle VLANs zu blockieren (13:58 Uhr).
* Dadurch war die Verbindung zum einzigen im dem Zeitpunkt noch auf
dem Nexus eingesteckten relevanten System (Infoblox) unterbrochen,
so dass im BFH Netzwerk keine neuen DHCP Leases mehr ausgegeben
wurden. Somit konnten sich Geraete die neu mit dem Netz verbunden
wurden, keine Adresse beziehen und waren defakto offline.
Gleichzeitig war fuer alle auch die Verbindung ins BEnet
unterbrochen, da diese eine letzte Verbindung auch noch
ueber den Nexus laeuft.
* Nach dem wir sogleich ins RZ geeilt sind, konnten wir unseren
Nexus um 14:30 wieder flicken. Fuer den BEnet Zugang hats bis knapp
vor 17 Uhr gedauert.
Wir entschuldigen uns fuer die dadurch enstandenen Unannehmlichkeiten
und danken fuer euer Verstaendnis.
Gruesse,
Daniel
--
Berner Fachhochschule / Bern University of Applied Sciences
Services / IT-Services
Daniel Baumann
Teamleiter Linux & Infrastructure Services
___________________________________________________________
Dammweg 3, CH-3013 Bern
Telefon direkt +41 31 848 48 22
Telefon Servicedesk +41 31 848 48 48
daniel.baumann at bfh.ch
https://bfh.ch
https://bfh.science
More information about the bfh-linux-announce
mailing list