Ceph "Abschaltung" per Ende Monat weil voll

Daniel Baumann daniel.baumann at bfh.ch
Thu Oct 11 11:47:47 CEST 2018


Hallo zusammen

kurze Fassung:

  * Leider haben wir es aus nicht-technischen Gruenden nicht geschafft,
    die Kapazitaet unseres Ceph Cluster rechtzeitig zu vergroessern.

  * Heute morgen wurde die maximal Belegung erreicht, bei welcher wir
    die Datenintegritaet garantieren koennen.

  * Wir werden daher spaetestens per Ende Monat den Cluster auf
    read-only umschalten muessen.

  * Folgende Dienste werden danach bis auf weiteres nicht mehr zur
    Verfuegung stehen:

    - rstudio.linux.bfh.ch
    - photoscan.linux.bfh.ch
    - *.lfe.bfh.ch (d.h. alle Container auf unseren Number Crunchern)

  * Alle Dateishares welche unter smb.ceph.bfh.ch resp. P:\LFE
    zugaenglich sind, werden weiterhin online bleiben, aber nur
    lesend (d.h. keine Schreibzugriffe: kein Aendern, Loeschen oder
    Hinzufuegen von Daten).


lange Erklaerung:

  * Die im 2016 bestehenden, konkreten Beduerfnisse nach Storage fuer
    LFE ueberstieg schon die Kapazitaet unseres Ceph Clusters. Als wir
    Ceph im Februar 2017 in den produktiven Betrieb ueberfuehrt haben,
    war daher ein Ausbau der Kapazitaet schon fuer das laufende Jahr
    geplant und budgetiert.

    Aufgrund einer internen Re-Priorisierung von personellen Ressourcen
    im Linux Bereich zu gunsten der NetApp Migration konnten wir den
    Ausbau nicht vornehmen und musste auf 2018 verschoben werden.

  * Im 2018 haben wir alle neuen Anfragen nach Storage auf Ceph
    abgelehnt resp. auf nach dem Ausbau vertroestet, damit fuer die
    aktuellen Nutzenden der Betrieb aufrecht erhalten werden kann.

  * Wir haben das "volllaufen" des Clusters auf Ende August 2018
    prognostiziert. Geplant und abgemacht war, dass Ende Maerz die
    Netzwerk-Adressierungen da sind und im Juli die Hardware
    eingebaut werden kann.

    Die Netzwerk-Adressierungen haben wir nach langem hin- und her
    erst Mitte September erhalten, die Hardware durfte bisher noch nicht
    bestellt werden.

  * Ab Freigabe der Hardware-Bestellung rechnen wir mit einer
    Lieferfrist von ungefaehr 6 Wochen. Danach muessen wir den Cluster
    von einem Rack auf zwei Racks erweitern (daher die notwendigen
    Netzwerk-Adressierungs Arbeiten und Umadressierung auf IPv6).

  * Wir rechnen damit, dass per Ende 1. Quartal 2019 der Dienst
    wieder normal aufgenommen werden kann.

  * Momentan gibt es keine alternative Ausweichsmoeglichkeit oder
    Linderungsmoeglichkeiten um den Betrieb aufrecht zu erhalten.
    Wir werden punktuell mit den Betroffen schauen, wo allenfalls
    individuelle Uebergangsloesungen gefunden werden koennen.

  * Wir bedauern dass es zu diesem Schritt kommt. Leider muessen
    wir diese Massnahme treffen, um die Datensicherheit und -integritaet
    gewaehrleisten zu koennen. Ceph zu "ueberfuellen" und Datenverlust
    in Kauf zu nehmen ist fuer uns keine Option.

Gruesse,
Daniel

-- 
Berner Fachhochschule / Bern University of Applied Sciences
IT-Services / Team Infrastructure Services
Daniel Baumann
IT System Engineer Linux
___________________________________________________________
Dammweg 3, CH-3013 Bern
Phone direct +41 31 848 48 22
Phone Servicedesk +41 31 848 48 48
daniel.baumann at bfh.ch
https://servicedesk.bfh.ch
https://www.bfh.ch
https://linux.bfh.ch


More information about the bfh-linux-announce mailing list