LNI Weekly #4 (2024-04-23)

Daniel Baumann daniel.baumann at bfh.ch
Wed Apr 24 09:24:58 CEST 2024


LNI Weekly #4 (2024-04-23)
##########################

1. Fachliches
=============

1.1 Ceph Hardware-Offerten
--------------------------

   * Bestellungen fuer den Lifecycle der Hardware sind soweit finalisiert
     und koennen Anfang Mai bei positivem Schulratsbeschluss durch die
     Beschaffungskoordination ausgeloest werden.
   * Weil Einfuehrungstermine fuer den U.2 non-JBF Server nicht absehbar
     sind, werden wir wohl die E.1 Variante nehmen.
   * ggf. koennen wir die U.2 SSDs durch Kauf von leeren Servern spaeter
     als Kapazitaetsvergroesserung dem Cluster hinzufuegen.

1.2 Repository Resetup
----------------------

   * Aktueller Stand:

     * stable/stable-security/stable-updates/stable-extras und
       stable-backports/stable-backports-extras Repositories fertig.
     * selektive Updates noch noetig fuer oldstable und oldoldstable,
       sowie neue Distribution fuer testing eroeffnen.
     * bisher keine Kompromitierten Repos gefunden.

   * Alle mit bookworm "duerfen" Updaten:
     https://progress-linux.org/doc/xz-fixup/

   * Weitere Arbeiten:

     * komisches "Netzwerk"-Problem auf den Server mit den neuen IPs
       loesen
     * Container Setup und Toolchain aktualisieren/testen,
       insbesondere Key side-loading in container-tools
     * BFH spezifisches (metapackages) updaten

1.2 Vauffelin
-------------

   * Ursache: Stromtunterbruch wegen Ausloesung einer Sicherung
   * Netzwerk laeuft provisorisch wieder (Netzteile/SFPs brauchen
     teilweise Ersatz)

1.3 Arista Bug Biel
-------------------

   * Flut von Neighbor Soliticitations Paketen fuehren zu CPU Load auf
     den Switches, dadurch werden Pakete gedroppt und eine Geraete
     "fallen" aus dem Netz.

   * Workaround: VTEP aus der Floodliste nehmen, dadurch VLANs aus denen
     die Neighbor Soliticitations Pakete kommen nicht mehr auf dem
     Switch.

   * Die Neighbor Soliticitations Paketen scheinen aus AP Netzen zu
     kommen.

1.4. Varia
----------

   * Simons Pick zu "New features in Arista EOS"
 
https://lists.bfh.science/private/bfh-linux-sysadmin/2024-April/003274.html

   * Wir nehmen am hpc-ch Forum teil und stellen uns kurz vor, wer
     machts? Folien? Als "Inspiration" vielleicht Portrait nehmen?
     https://web.bfh.info/team/about/

     Ideale Moeglichkeit fuer die noch offene Stelle zu besetzen, sofern
     wir denn duerfen.

   * Seitenblick und Tandem (RSR):
 
https://lists.bfh.science/private/bfh-linux-sysadmin/2024-April/003262.html

2. Administratives
==================

2.1 LAN Kabel fuer Dammmweg
---------------------------

   * Mit Arbeitswelt 4.0 ersetzen wir alle LAN Kabel weil uralt auf neu,
     einheitlich und passende Laenge: Pascal/Urs bitte einmal
     bestellen :)

2.2 Bedag Materiallieferung
---------------------------

   * Die fehlenden 720XP Netzteile wurden geliefert, bcp1 uebergibt sie
     an Enkom.

2.2 Werte und Normen
--------------------

   * Zweiter Team-Workshop zu "Normen und Werte" von letzter Woche:
     miroboard-normen-und-werte.pdf

Kontext und Auftrag
~~~~~~~~~~~~~~~~~~~

"Die Teams haben im Miro-Board Feedback gegeben, wie die Zusammenarbeit
unter den Teams verbessert werden kann. Der Auftrag war, sich im Team
Gedanken zu machen wie die genannten Punkte verbessert oder Probleme
gelöst werden können. Der nächste Workshop findet am 24.04. statt und
ich denke diese Punkte werden wir dort besprechen."

Ablauf
~~~~~~

   * Alle Karten wurden vorglesen, unklarheiten geklärt.

   * Eine individuelle Antwort auf jede Karte wurde vom Team nicht als
     zielführend empfunden.

   * Die gemeldeten Probleme wurden in die folgenden Themen aufgeteilt:

     1. Technisches
     2. "Zugänglichkeit"
     3. Verhalten

     Jedes Thema wurde diskutiert und mögliche Massnahmen vorgeschlagen.

Antworten von LNI
~~~~~~~~~~~~~~~~~

1. Technisches:

    Wir haben ein Backlog und die Tasks werden von der IT-Leitung
    ausgewählt und priorisiert (ausserhalb der Kontrolle von LNI).

2. "Zugänglichkeit":

    Wir sind darauf angewiesen, dass alle Infos in Tickets sind,
    da die unterschiedlichen Arbeiten einer Anfrage von unterschiedlichen
    Personen und asynchron erledigt werden und so der Informationsfluss
    sichergestellt werden kann. Diese Arbeitsweise funktioniert für uns
    im Team sehr gut, darum wenn immer möglich bitte ein Ticket
    erstellen.

    Zusätzliche, neue Massnahmen:

    * Notfallliste für sehr wichtige und dringende Probleme wie
      groessere Stoerungen und Ausfaelle.

    * Anlaufstelle für:

      * Personen die keine Tickets machen koennen oder wollen
      * Anliegen die nicht in ein Ticket passen
      * kein Ersatz fuer Requirements Engineering, dafuer koennen
        (mit Vorlauf und ggf. Priorisierung) Termine fuer eine
        vorbereitetes Treffen (mit Protokoll) vereinbart werden.

3. Verhalten:

    Wir sind der Meinung, dass viele Problem auf Missverständnissen
    beruhen. Mehr Information was LNI macht und weshalb (z.B. am
    Morning Mixer) wäre wünschenswert ("Expectation management").

    Massnahmen:

    * Wir suchen weiterhin nach Möglichkeiten zu informieren (Bisher
      wurden die Angebote von LNI zu informieren von der IT-Leitung
      abgelehnt).

2.2 Wartungsfenster KW17
------------------------

   * geplante Wartungsfenster?

3. Organisatorisches
====================

3.1 Backlog
-----------

   * https://bfh.info/team/backlog

   * erledigt:

     * Network - Legacy - Architecture/Design:

       * DHCP relay supppression
       * Switchport default routed ohne IP, statt vlan 0/1/2 zu verwenden
       * Gundsaetzentscheid: Labor Netze und FM Reihenfolge

     * Network - Legacy - LAN (underlay):

       * configure STP priority on leafs and subleafs

     * Network - Legacy - LAN (EVPN overlay):

       * "VTEP Outbound Route Filtering" (stop redistributing routes from
         other leafs to spines: underlay_filter_peer_as)
       * Fabric-B Uplink: neues route-leaking Schema

   * neu:

     * Network - Feature - Lab:

       * make lab usable (without reading the scripts) and deployable

     * Projects:

       * allgemeins Audit der Linux Infrastruktur

3.2 Priorisierung gbs4 KW17
---------------------------

   * Netz: gemaess Backlog (shs1)
   * Rollout: gemaess Backlog (bcp1/gau1)
   * Linux: keine koordinierten Arbeiten bis wir wieder Container
     erstellen koennen

   * xz-backdoor Mail auf bfh-linux-announce
   * Repository Resetup

  -- Daniel Baumann <daniel.baumann at bfh.ch>  Tue, 23 Apr 2024 06:53:24 +0200


More information about the bfh-linux-news mailing list