Fachartikel
Automatische Überwachung einer IT-Landschaft

Praktisch alle kritischen Prozesse in Unternehmen beruhen heute auf der digitalen Verarbeitung von Informationskapital. Fallen IT-Komponenten aus, kann dies unmittelbar die Geschäftstätigkeit des Unternehmens beeinflussen. Dementsprechend wichtig ist es, Ausfälle innerhalb kürzester Zeit zu beheben. Doch aktuelle Entwicklungen wie Virtualisierung oder Serviceorientierte Architekturen führen dazu, dass IT-Infrastrukturen immer komplexer und dynamischer werden. Die Identifizierung der Ursache eines Systemausfalles gleicht der berühmten Suche nach der Nadel im Heuhaufen und kostet nicht nur wertvolle Zeit, sondern vor allem personelle Ressourcen und Geld. Darüber hinaus setzt ein gezieltes Problem-Management voraus, dass die Verantwortlichen die wirtschaftlichen Folgen eines Ausfalls einschätzen können, um die richtigen Prioritäten zur Fehlerbehebung festzulegen Es ist eben ein Unterschied, ob die Buchhaltung zwei Stunden keine Rechnungen schreiben kann oder ob bei einem Webshop der Auftragseingang für zwei Stunden lahm liegt. Voraussetzung für ein gezieltes Vorgehen ist eine automatisierte, übergreifende Überwachung und Verwaltung aller Hardware-Ressourcen sowie der Applikationen.

Analyse der Netzwerkkomponenten

Klassische Ansätze versuchen das Zusammenspiel der einzelnen Komponenten durch die manuelle Definition von Regeln zu lösen. Sobald sich ein Objekt der Infrastruktur verändert, muss das Regelwerk allerdings wieder angepasst werden. Angesichts der heutigen Dynamik und Komplexität von IT-Architekturen ist dieses Vorgehen zum Scheitern verurteilt. Abhilfe schafft ein modellbasierter Ansatz, wie ihn die EMC Smarts Software verfolgt. Dieser ermöglicht eine ganzheitliche, technologieübergreifende und herstellerunabhängige Analyse von Speicher-, Netz- und Serverbereichen sowie der eingesetzten Anwendungen. Grundlage ist das EMC Common Information Model (ECIM), das alle Komponenten, deren Beziehungen zueinander, ihre Verhaltensweisen und Fehlersymptome generisch beschreibt. Die aktuelle IT-Infrastruktur wird per Discovery-Funktion automatisch erkannt - im ersten Schritt werden die einzelnen Komponenten erfasst und in einer Topologie-Datenbank abgelegt. Im zweiten Schritt werden diese Objekte mit dem ECIM Modell abgeglichen, alle im Modell beschriebenen potentiellen Beziehungen werden mit der Realität überprüft und ebenfalls in die Topologie übernommen. Damit wird die aktuelle Infrastruktur dem Operator komplett und transparent visualisiert. Jedes ursächliche Problem in der Infrastruktur hat eine bestimmte Signatur, die sich aus den Symptomen zusammensetzt, die es auslöst - sowohl in der tatsächlich betroffenen Komponente als auch in den damit verbundenen Netzwerkbausteinen und Applikationen. Im dritten Schritt erfolgt die Zuordnung dieser im ECIM Modell erfassten möglichen Symptome zu den existierenden Komponenten und den dazugehörigen „Root-Causes" in einer Matrix - dem patentierten EMC Codebook. Spätere Änderungen in der Infrastruktur werden in Echtzeit erkannt und mit der Topologie-Datenbank und dem Codebook synchronisiert. Beim Monitoring der IT-Umgebung werden bei auftretenden Störungen aus der Flut der Alarmmeldungen nur die relevanten Alarme - authentische Symptome - herausgefiltert und mit Hilfe des Codebuches wird eine Signatur erkannt und damit das ursächliche Problem identifiziert. Aufgrund vorab hinterlegter Wertigkeiten und Zuordnung zu Geschäftsprozessen kann zusätzlich die Auswirkung auf Geschäftsprozesse und die Priorisierung der Fehlerbeseitigung automatisch angezeigt werden.

Monitoring in virtualisierten Umgebungen

Wird ein solcher modellbasierter Ansatz angewendet, kann der verantwortliche Administrator die entsprechenden Maßnahmen sofort einleiten und die Behebung der Störung an die entsprechenden Teams delegieren. Dieses Vorgehen steigert die Produktivität, da nicht mehr wie zuvor mehrere Teams gleichzeitig an der Identifizierung eines Problems arbeiten müssen. In virtualisierten Umgebungen steigt die Komplexität rasant an, da virtuelle Ressourcen dynamisch nach Bedarf auf verschiedenen physischen Ressourcen abgestützt werden. Eine direkte Zuordnung von virtuellen zu physischen Ressourcen zu jedem Zeitpunkt ist manuell nicht mehr möglich, ist aber für eine schnelle Fehlerisolierung unerlässlich. Schon allein die Abschaltung eines Servers zu Wartungszwecken kann unter diesen Umständen ungeahnte Folgen nach sich ziehen. Der EMC Smarts Application Discovery Manager 6.0 (ADM) erkennt die im Rechenzentrumsbetrieb benutzten Applikationen, kennt deren Zuordnung zu virtuellen Maschinen und deren Beziehung zu den darunter liegenden physischen Ressourcen. Konfigurationsänderungen sowie virtualisierte und physische Beziehungen in der Applikationsinfrastruktur werden automatisch erkannt und abgebildet. Damit wird die Darstellung, Überwachung und Kontrolle des IT-Betriebs nicht nur in physischen sondern auch virtualisierten und gemischten Infrastrukturen in Echtzeit möglich.

Einhaltung von Compliance-Vorschriften

Eine weitere kritische Herausforderung sind zunehmend strenge unternehmensinterne wie behördliche Compliance-Anforderungen. Neben der Einhaltung dieser Regeln zu jedem Zeitpunkt müssen auch regelmäßig Audits mit entsprechenden Reports durchgeführt werden. Besonders in virtuellen Umgebungen ist es unerlässlich, jederzeit den Überblick über Daten, Anwendungen und Prozesse zu behalten. Auch hier helfen automatisierte, modellbasierte Werkzeuge, die kontinuierlich Änderungen in Change- und Konfigurationsprozessen kontrollieren. Für den Fall von Compliance-Verletzungen können somit automatisch Prozesse initiiert werden, um den jeweiligen Vorgang zu unterbrechen oder gegebenenfalls sogar automatisch zu korrigieren. Somit werden mögliche Service-Ausfälle verringert und das Risiko von etwaigen Vertragsstrafen minimiert.

Autor: Lutz Rackow, Product Marketing Manager EMEA, EMC

Notes: