20. April 2022

Libelle IT-Glossar Teil 8: Hochverfügbarkeit – Uneingeschränkter Betrieb trotz Ausfall eines Systems

AuthorDaniel Krüger

Besonders innerhalb der IT-Branche gewinnt das Thema „Hochverfügbarkeit“ an Aufmerksamkeit. Besonders im laufenden Betrieb kann ein Systemausfall schnell teuer werden. So ist für Unternehmen die Sicherstellung der Verfügbarkeit ihrer Systeme und Systemkomponenten ein “MUSS”. Dabei ist das Aufstellen eines Hochverfügbarkeitskonzepts dringend notwendig. Während eines Ausfalls soll es im Idealfall zu keiner oder nur zu einer kurzen Unterbrechung kommen. Doch wie definieren Unternehmen Hochverfügbarkeit?

Definition Hochverfügbarkeit

Hochverfügbarkeit (abgekürzt auch HA, abgeleitet von engl. high availability) beschreibt somit die möglichst dauerhafte Verfügbarkeit eines Systems oder einer Komponente in der (IT-)Infrastruktur eines Unternehmens, auch in einer Ausfallsituation.

Hierfür nutzen Unternehmen oftmals spezialisierte High Availability Software-Lösungen, die somit nicht nur vor den Folgen von Hardware- und Anwendungsfehlern, sondern auch vor den Folgen von Elementarschäden, Sabotage oder Datenverlusten durch menschliche Fehler schützen.

Ist Hochverfügbarkeit messbar?

Um eine grobe Vorstellung davon zu haben, wie hoch die Verfügbarkeit innerhalb eines Unternehmens aktuell ist, wird oft zu dieser altbekannten Formel gegriffen:

Verfügbarkeit = (Minuten im Monat - Minuten der Ausfallzeit) * Minuten im Monat


Doch müssen Unternehmen Hochverfügbarkeit zu 100% gewährleisten oder reicht auch eine Teillösung und wie können Unternehmen diese erreichen? In unserem achten Teil des Libelle IT-Glossars klären wir genau diese Fragen.

AEC: Wie viel Hochverfügbarkeit braucht ein Unternehmen?

Gerade in Bezug auf die Kosten, stellen sich IT-Verantwortliche und Administratoren in den Unternehmen die Frage, wie hochverfügbar ihrer Systeme wirklich sein müssen und welche Ausfallzeiten in der täglichen Praxis tolerierbar sind.

Mit Hilfe des Availibilty Environments (AE), welche von den Analysten der Havard Research Group erstellt wurde, können Unternehmen ihre „Verfügbarkeitsumgebungen“ klassifizieren. Dabei spricht man auch von der so genannten Availibility Environment Classifications (AEC) Klassifizierung. Die einzelnen Faktoren beleuchten die Auswirkungen, die im Ausfall der entsprechenden Dienste und Systeme auf das Unternehmen und die Endnutzer / Kunden hat:

AE-0: Hier kann, ohne dass es vermeintlich geschäftskritisch wird, der Betrieb unterbrochen werden. Die Verfügbarkeit der Daten ist somit nicht geschäftskritisch innerhalb des laufenden Betriebs. Bei einem Ausfall bedeutet das für Endanwender, dass es zum Verlust von Daten kommen kann bzw. diese beschädigt werden.

AE-1: Bei dieser Verfügbarkeitsklasse geht es um Geschäftsfunktionen, diese können unterbrochen werden. Allerdings muss sichergestellt werden, dass das System die Verfügbarkeit der Daten weiterhin garantiert. Aus Kundensicht kommt es zu einer unvorhergesehenen Unterbrechung der Arbeit und nicht zu kontrollierende Shutdowns. Dabei ist aber die Integrität der Daten ist weiterhin gewährleistet. Auf einem redundanten Speicher stehen die Daten als Backup-Kopie zur Verfügung. Um unvollständige Transaktionen zu entdecken oder die Daten mit Hilfe des Backups wiederherzustellen, kommen oft Dateisystem mit Journal-Funktionen oder entsprechenden Protokollfunktionen (log-based) zum Einsatz.

AE-2: Bei dieser Verfügbarkeitsstufe darf es nur zu einer minimalen Unterbrechung der Dienste innerhalb der Geschäftsfunktionen kommen. Dabei ist ein genauer zeitlicher Rahmen festgelegt. Es kommt für die Anwender zu einer kurzen Unterbrechung, nach der Sie sich gleich wieder anmelden können. Allerdings kann es dabei in Einzelfällen notwendig sein, dass Sie einige Transaktionen mit Hilfe der Protokolldateien neu ablaufen lassen müssen und Sie eine Verschlechterung der Performance bemerken.

AE-3: Bei dieser Klasse der Hochverfügbarkeit geht es um Geschäftsfunktionen, die ohne Unterbrechung ausgeführt werden müssen. Dies gilt für ein genau festgelegtes Zeitzeitfenster, meisten für bestimmte Stunden eines Tages sowie die meisten Tage einer Woche eines Geschäftsjahres. So können alle konstant und ohne Unterbrechungen arbeiten. Trotzdem kann es dabei vorkommen, dass eine Transaktion wiederholt werden muss, was der Nutzer aber nicht durch eine Unterbrechung des Betriebs, sondern höchstens durch Einbußen bei der Performance bemerkt.

AE-4: Alle Geschäftsfunktionen verlangen einen kontinuierlichen Betrieb der IT und der Dienste. Für die Anwender müssen deshalb alle eventuell auftretende Fehler vollkommen transparent kommuniziert werden. Das bedeutet, dass die Systeme einen 24x7-Betrieb und eine unterbrechungsfreie Arbeit gewährleisten müssen. Oftmals nutzen Unternehmen hierfür eine Software, welche die Daten und Systeme spiegelt.

Wie erreicht man eine hohe System-Verfügbarkeit?

Um Unterbrechungen für das Unternehmen zu minimieren bzw. zu vermeiden, sollte ein hochverfügbares System in der Lage sein, sich schnell von jeder Art von Fehlerzustand zu erholen. Folgende Punkte können dabei helfen und unterstützen die High Availability in Ihren Unternehmen zu gewährleisten:

  • Finden und Beseitigen von einzelne Fehlerstellen oder System-Knotenpunkten
  • Alle Systeme und Daten sollten eine einfache Wiederherstellung gewährleisten
  • Verwendung von Load Balancing, um den Anwendungs- und Netzwerkverkehr auf Server oder anderen Hardwarekomponenten zu verteilen.
  • Zustands des Backend-Servers kontinuierlich überwachen
  • Verteilung von Ressourcen im Falle von Stromausfällen oder Naturkatastrophen (geografisch)
  • Implementierung von zuverlässigen Crossover oder Failover Lösungen in Bezug auf die Speicherung
  • Einrichtung eines Systems, das Ausfälle sofort erkennt
  • Entwurf eines Systemteile für eine hohe Verfügbarkeit und die Sicherstellung der Funktionalität durch regelmäßige Tests

Dem Ernstfall vorbeugen mit Libelle BusinessShadow®

Mit unserer Lösung Libelle BusinessShadow® für Hochverfügbarkeit und Disaster Recovery können Sie SAP®-Landschaften und andere Applikationssysteme zeitversetzt spiegeln. Ihr Unternehmen ist somit nicht nur vor den Folgen von Hardware- und Anwendungsfehlern, sondern auch vor den Folgen von Elementarschäden, Sabotage oder Datenverlusten durch menschliche Fehler geschützt.

Sie möchten noch mehr zu Begriffen aus der IT lernen? Zum Beispiel was Business Continuity genau bedeutet oder worin der Unterschied zwischen Produktiv-, Entwicklungs-, und QS-System liegt? Dann besuchen Sie gerne unser Libelle IT-Glossar oder folgen Sie uns auf LinkedIn und Facebook.


Empfohlenene Artikel
22. Dezember 2022 Libelle IT-Glossar Teil 22: Was ist DevOps?
23. September 2022 Datenverlust: So können Sie Ihre Daten und IT schützen

Alle Blogartikel