Teil B: Parallel und Effizient zum Ergebnis

Rechenleistung ist durch nichts zu ersetzen, außer durch mehr Rechenleistung. Für die meisten praktischen Anwendungen reicht aber ein aktueller Rechner mit 2 oder 4 Kernen. Wir sind in der glücklichen Lage, große Projekte automatisch zerlegen zu lassen und die Teilgebiete auf getrennten Kernen, Prozessoren oder Rechnern zu bearbeiten. So kann man bei Bedarf Workstations mit über 50 Kernen oder vernetzte Computer (Cluster) mit einigen 10000 Kernen hinzuziehen. Das ist heute nicht mehr nur Universitäten und Forschungseinrichtungen vorbehalten. Rechenleistung kann man pro Kern und Stunde online mieten und vom heimischen PC aus steuern.

  1. Methodik der Parallelisierung (1h)
    • Gebietszerlegung eines Projektes in eigenständige Teilgebiete
    • Parallele Ausführung von Telemac auf verschiedenen Prozessoren und Rechnern
    • Vereinigung der Ergebnisse
    • Das Message Passing Interface (MPI)

    KAFFEE

  2. Übung B-I: Parallelrechnung (1h)
    • Zerlegen eines Flussmodells in Teilmodelle mit Partel
    • Testrechnungen mit unterschiedlicher Prozessorenanzahl
    • Fusionieren der Teilmodelle mit Gretel
    • Visualisierung zerlegter Gebiete mit Paraview
  3. Richtige Konfiguration (30min)
    • Effizient Rechnen
    • Schnell Rechnen
    • Dezentral Rechnen

    MITTAGESSEN

  4. Zum Verständnis von Desktop / Workstation / Clusterlayout (45min)
    • Hardwareunterschiede verstehen
    • Netzwerkunterschiede
    • Richtige Lastverteilung bei verteiltem Rechnen
    • Vor- und Nachteile von kommerziellen Cloudanbietern
    • Die richtige Hardware für das richtige Projekt
  5. Demonstration: Rechnen auf Clustern kommerzieller Drittanbieter (20min)
  6. KAFFEE

  7. Ressourcen effizient nutzen / Warteschlangensoftware (Torque / OpenPBS)  (45min)
    • Warteschlangen für Berechnungsaufträge
    • Prioritäten: Eiliges vorziehen
    • Effizient Aufträge über mehrere Workstations automatisch verteilen lassen
  8. Übung B-II: Warteschlangensoftware (1h)
    • Mehrere Rechner werden zu einem einfachen Workstationcluster verbunden
    • Jeder Teilnehmer erstellt 3 Aufträge mit unterschiedlichen Prioritäten
    • Der Masterserver verteilt die Aufträge auf alle verfügbaren Einzelrechner