Ceph: aktueller Stand
Daniel Baumann
daniel.baumann at bfh.ch
Fri Apr 16 10:39:44 CEST 2021
Hallo zusammen
hier der aktuelle Stand nach einer ereignisreichen Nacht (dazu dann mehr
spaeter in zwei separaten Mails fuer die technisch Interessierten und
zur Dokumentationin im Verlauf der nachsten Tage)..
Vorfall
=======
* seit Donnerstag um 06:35 Uhr sind alle Ceph Shares offline.
* Grund: Verkettung von vier "Murphy's law"-Ereignissen rund um
die Situation, dass unser Cluster aktuell nur halbe Groesse/
halbe Redundanz hat wegen des RZ-Umzug, der letztes Jahr mittendrin
abgebrochen werden musste.
Auswirkungen
============
* alle "Enduser-Systeme" in der Science DMZ (*.bfh.science) sind
offline: z.B. alle Number Cruncher-Dienste, viele Web- und
Datenbankserver, Nextcloud sowie alle SMB Shares (P:\LFE) und
viele weitere kleinere Dienste stehen im Moment nicht zur
Verfuegung.
* alle Basis-Dienste in der Science DMZ laufen segregiert und sind
nicht betroffen. Alle LNI-Dienste die noch nicht in der Science DMZ
laufen, d.h. Linux-Altlasten in *.bfh.ch, sind nicht betroffen.
* alle Daten auf dem Ceph Cluster sind sicher, garantiert (haben wir
ueberprueft).
Weitere Schritte
================
* die erste Speicherbereinigung von dem rund 1 Petabyte
(= 1'000 Terabyte) Daten das auf Ceph liegt, laeuft und wird ca.
Samstag morgen fertig sein. Danach erst kann die notwendige
Loeschung von alten Snapshots erfolgen.
* die zweite Speicherbereinigung laeuft ca. bis Sonntag Mittag.
* voraussichtlich im Verlauf des Sonntag Abends sind alle Systeme
wieder online und alle Dienste stehen wie gewohnt zur Verfuegung.
Danke fuers Verstaendnis.
Gruesse,
Daniel
--
Berner Fachhochschule / Bern University of Applied Sciences
Services / IT-Services
Daniel Baumann
Teamleiter Linux & Infrastructure Services
___________________________________________________________
Dammweg 3, CH-3013 Bern
Telefon direkt +41 31 848 48 22
Telefon Servicedesk +41 31 848 48 48
daniel.baumann at bfh.ch
https://bfh.ch
https://bfh.science
More information about the bfh-linux-announce
mailing list