Werkzeuge der Service Sicherstellung

Im Bereich vom SLA-Management ist ein gewisser Besatz an Tools unverzichtbar, um die Aufgaben zu erledigen. Allerdings ist das Thema komplex und die Transparenz der Funktionen nicht gegeben. Entscheider sind darum auch weniger bereit, hier zu Investieren, wenn der Sinn und Konzept nicht klar erkennbar ist. Als ersten Schritt der Transparenz versuche ich hier, eine herstellerunbhängige Übersicht zu geben, die mögliche Kandidaten vorselektiert. Die Liste wird fortgeschrieben und beinhaltet sehr unterschiedliche Tools, deren Klassen ich grob identifiziere, auch wenn sie sich in manchen Fällen überschneiden:

  1. Monitoring-Tools mit Gewinnung der Metrics und KPIs
  2. Diagnose-Tools zur Fehleranalyse von Produktionsumgebungen
  3. SLA-Regelprozessoren zur Auswertung und Zuordnung der KPIs
  4. Ticketing-Systeme für Incident und Problem-Tracking.

Weitere Funktionen, die ich hier aber ausblende, wären Planungstools zum Requirements- und Kapazitätsmanagement. Reporting-Tools sind in der Regel eingeschlossen und werden als gegeben zunächst nicht getrennt vertiefend behandelt.

Der Bedarf nach Werkzeugen liegt auf der Hand, denn einige kurze Überlegungen lassen die Grenzen von ad-hoc Spreadsheets erkennen, um einen Satz unterschiedlicher SLAs bezogen auf die Produktion zu überwachen.

Mein besonderes Interesse gilt hier vor allem der Klasse D- SLM: Regel Editor und Prozessor. Um diese zu Verstehen ist jedoch ein Verständnis der anderen Klassen sinnvoll.


Kriterien-Katalog und Matrix

Wegen der Unübersichtlichkeit muss man die Tools nach Kriterien einer Matrix wegen zuordnen. Da manche Tools auch klassenübergreifend sind, ist die Gliederung nach Einzelkriterien sinnvoll. Zum Aufbau einer Matrix zur Produktauswahl empfiehlt sich, die Spalte 'Wichtung' einzuführen, dass die Anforderungen der jeweiligen Kundensituation zum Ausdruck bringt. Die Einzelwerte in den Spalten sind darum besser numerisch auszudrücken, damit eine gewichtete Verrechnung möglich ist.

Empfohlen sind

. .0. keine Unterstützung

  1. Grundfunktionen, bzw. einfache Erweiterbarkeit
  2. Solide Funktionen
  3. Exzellente Funktion

Die folgenden Kriterien sind gruppiert und grundsätzlich erweiterbar. Zu den einzelnen Tool-Gruppen nenne ich klassische Vertreter, ohne diese direkt zu beurteilen. Nicht alle Werkzeugklassen werden überall gebrauch. Ein Requirements Management kann den Bedarf einem möglichen Aufwand gegenüberstellen und ermitteln, ob ein Werkzeugeinsatz gerechtfertigt ist.

Eine Matrix hier aktuell zu halten übersteigt das vertretbare Online-Angebot. Gerne stehe ich Ihnen zur Beratung zu Verfügung. Kontaktieren Sie mich ....

0- Basis-Kriterien

Diese Kriterien gelten Übergraeifend für die Tool-Klassen und werden darum bei den einzelnen Tool-Klassen nicht mehr separat gelistet:

  1. Zeitnahe Anzeige des Systemzustandes nach konfigurierbaren Kriterien
  2. Plug-In Architektur für weitere Metrics oder Funktionen
  3. Plug-In selbst programmierbar - Dokumentation
  4. Langzeit-Recording der Messwerte
    1. Datenspeicherung - Datenbank
    2. Schnittstelle für Drittsysteme - Dokumentation
  5. Eskallation von Problemen:
    1. Notifikation per Email, SMS
    2. Generierung von Incidents
  6. Reports:
    1. Eingebaute Reports, vorkonfiguriert
    2. Reports Management-geeignet.
    3. Report-Generator zur Anpassung
    4. OLAP-Funktionalität
    5. Reports auch für Drittsysteme

Anmerkungen zum Reporting: Fertige Turn-key Reports haben eine Attraktion, da sie eine erhebliche Reduzierung des Aufwandes bedeuten und die Unsicherheit nehmen können, ob eine bestimmte Auswertung überhaupt machbar ist.

Andererseits sind Berichtsanforderungen oftmals umfassend über mehrere Datenquellen hinweg, so dass Berichtssysteme besser nicht zu eng an ein untergeordnetes Teilsystem zu fixieren sind. Es sei denn, es handelt sich um hoch spezialisierte Reports, die als Black-Box-Lösung ihre Alleinstellung erhalten. Analoges gilt parallel zu den Standard-Berichten zu OLAP-Anforderungen.

Liefert ein System eine ausgefeilte Berichts- und OLAP-Infrastruktur, ggf. mit customizable Dashboard, die auch gern homogen von Drittanwendungen verwendet werden will, wäre eine Öfnung des Berichtssystemes für Drittdaten eine interessante Variante.

A- Server Monitoring

Klassisches Systems-Management. Hier denkt man zunächst an Tools wie die Tivoli-Familie, HP Open View, BMC Patrol oder Oracle Enterprise Manager/Grid Control. Daneben sind auch leistungsfähige Werkzeuge aus dem Open Source Bereichen oder Mid-Range-Bereichen verfügbar.

  1. Agent Architektur auf verschiedenen Plattformen
    1. Windows
    2. Linux
    3. AIX
    4. Solaris
    5. andere Unix-Derivate
    6. AS400
    7. ZOS
  2. Vordefinierter Support für
    1. Betriebssystem: CPU, Speicher, IO, Memory-Utlisation ...
    2. Datenbank: Auslastung Table-Spaces, Locks, Sessions ... ggf. welche DB
    3. Middleware: Web-Server, Application Server, ...

B- Client / Protokoll Monitoring

Hier sind im Besonderen zu nennen Moniforce UX Insight, jetzt Oracle RUEI für http-Real User Monitoring und Oracle Grid Controll für synthetische Tests.

  1. Synthetische Tests (Robots / Beacons)
  2. Real User Tests
  3. Protokollanalyse
  4. Technologie-Unterstützung
    1. HTTP
    2. HTTPS
    3. SOAP
    4. Java RMI
    5. TCP/IP
    6. DB-Netzwerk-Protokolle (Oracle Net)
  5. Voller Datenstrom - Speicherung
    1. Ausblendung von Security-Relevanten Records
    2. Unterstützung bei Fehlern
  6. Geringe Performance-Belastung der Produktionssysteme.

C- Session Diagnose und Störungsbehebung

Als Beispiel sind hier die klassischen IDEs zu nennen, Eclipse und Visual Studio, die allerdings auf das Debugging in der Testumgebung ausgerichtet sind. Produktionssupport für User-Sessions wird mehr oder weniger Aussagekräftig auch über Datenbak-Werkzeuge möglich. Bekannt sind vor allem Oracle AD4J, welches Java auch herstellerunabhängig unterstützt. Spezialisierte Tools zur Störungsbeseitigung sind nicht immer zwingend erforderlich. Man hofft, durch QS-Maßnahmen die Notwendigkeit für dies Tools zu eliminieren. Die Realität sieht jedoch anders aus, und macht einen Einsatz derartiger Tools oft sinnvoll.

  1. Produktions-Überwachung
    1. Real User: Automatisch / Einschaltbar
    2. Synthetische Agenten
    3. Remote Control
  2. Technologie-Unterstützung
    1. HTTP
    2. HTTPS
    3. SOAP
    4. Java RMI
    5. TCP/IP
    6. Datenbank Sessions
    7. DB-Netzwerk-Protokolle (Oracle Net)
  3. Herstellerübergreifend
  4. Tansparente Verfolgung der Systemkomponenten
    1. Front-End
    2. Middelware
    3. App-Server
    4. Datenbank
  5. Tracing / Stepping / Code Editor
  6. Verzahnung mit Entwicklungsumgebung
  7. Profiling / Timing der Aufrufe
  8. Replay der Problemtransaktionen
  9. Dokumentationssupport
  10. Aktive Komponenten zur Störungsbeseitigung

D- SLM: Regel Editor und Prozessor

Als dediziertes Tool ist OBLICORE GUARANTEE zu nennen. Laut Forrester Research hätte diese einen unique Approach Einige Produkte sind hier im Kontext von umfassenden ITIL-Suiten angeboten, Z.B. BMC Service Level Management, IBM Tivoli Service Level Advisor, FrontRange SLM. Im Rahmen der anderen Anbieter werden ebenfalls SLM-Module angeboten, die oftmals jedoch nur Basisfunktionen bieten. Der Markt ist heir sehr dünn und in der Praxis wird ein ausgereiftes SLM-Tool eher selten eingesetzt.

  1. Vertrags und Kontaktverwaltung
  2. Versionierung
  3. Strukturierte Abbildung der Service Rules
  4. Abbildung von Bonus-Malus-Modellen
  5. Unterstützung für Underpinning Contracts / OLAs
  6. Kommunikationsunterstützung / Rollen für
    1. Service-Manager
    2. Service-Nehmer
    3. OLA-Provider
    4. Service-Personal
  7. Verlinkung relevanter Service Ereignisse und Merkmale
  8. Verlinkung mit dem Configuration Management - CMDB
  9. Dokumentenverwaltung: Dokumentation von Abstimmungen / Protokolle
  10. Definition der Servicezeiten
    1. Multiple Periodendefinition
    2. Routine Wartungsfenster / Sonderwartungsfenster
    3. Prozessunterstützung für Wartungsfenster
    4. Werkskalender / Regionale Kalender
  11. Verlinkung mit Service Monitoring - Inkludieren der Metrics
  12. Verlinkung mit Incident Management - Inkludieren der IM-Metrics
  13. Verlinkung mit Change Management - Abstimmung Servicezeiten
  14. Klassifizierung von kritischen Service-Ereignissen (Editor)
  15. Regelprozessor
  16. Service Reports: Impact Analyse / Vorschau / Abrechnung

E- Incident / Problem Ticketing

ITIL Incident Management und Problem Management werden unterscheiden, nicht zuletzt, da hier andere Kategorien der Bearbeitung und der SLA's gelten. Merksatz: Wenn ein Incident mittels Work-Around geschlossen wurde, ist das Problem noch nicht unbedingt behoben. Oftmals unterstützen Hersteller aber beide Management-Bereiche, auch ntegriert. Darum hier die Zusammenschau

Bekanntestes Tool ist BMC Remedy Action Request System - ARS -. Allerdings ist gibt es viele Ticketing Systeme auf dem Markt (z.B. Insel), auch im Open Source Segment (z.B. OTRS auch bei wikipedia . Um ein Ticketing System kommt keine Service Organisation herum.

  1. Dialoge zur Incident Erfassung und Verfolgung
    1. Web-Anwendung
    2. Fat-Client
    3. Telefonie-Support - CTI
  2. Benutzerfreundlichkeit
  3. Automatisierte Schnittstellen zu Drittsystemen
    1. Ticket-Benerierung
    2. SOA
  4. Klassifizierung und Filterung
    1. Volltext-Suche
    2. Komplexe Filterbedingungen
  5. Reporting: Status nach Incident-Klassen, Wartezeiten, SLA-Bezug

Anbieter und Produkte

Da in der Regel große Organisationen betroffen sind und die Regel bekannt ist, dass Große am liebsten bei Großen kaufen, wären vor allem die namhaften Anbieter von Systems Management Anbietern zu betrachten. Die Paletten dieser werden oft durch Firmenzukäufe erweitert, dass bereits das Portfolio eines Herstellers recht unübersichtlich werden kann. Meines Erachtens gibt es allerdings noch Mängel im Produktangebot, vor allem bei leistungsfähigen SLM-Tools im Midrange Bereich.

Ergänzt wird das Marktangebot durch kleinere Spezial-Anbieter, die vor allem mit Leistungen werben, die eben kein großer Anbieter befriedigen kann. Ob diese Firmen unabhängig bleiben kann sicher niemand sagen, aber auch große Firmen wurden schon von noch Größeren gekauft.

Eine neutrale Produktgegenüberstellung auf Grundlage transparenter Kriterien ist in jedem Fall sinnvoll, denn unter den gleichen Schlagworten finden sich oft genug völlig verschiedene Inhalte. Die Details und Einschätzung können jedoch im Einzelfall jedoch unzutreffend sein eine Gewähr über Produkteigenschaften kann hier nicht gegeben werden. Die Darstellungen dienen der Orientierung und müssen selber im Detail geprüft und beurteilt werden, bzw. in einem Beratungsprojekt vertieft werden.

Oracle

Den Anfang der Betrachtungen mache ich mit Oracle, der sich von seinem Image als Datenbank-Lieferant mit umfangreichen Produktpaletten in vielen Bereichen - Business-Applications, Middleware, Development-Tools uvm. - gewandelt hat. Oracle bietet bereits mehrere Werkzeuge an, die hier positioniert sind

  • Oracle Real User Experience Insight (RUEI) - vormals Moniforce UXInsight: Eine umfassenede Lösung der Protokollanalyse mit einer zugeschalteten Sniffer-Appliance (Terrabyte-Server). Eingebaut sind aussagekräftige OLAP Auswertungen und Dashboard. Hervorragend zur weitgehend kompletten Abdeckung des Produktionsgeschehen, jedoch nur HTTP / HTTPS. Interna der Applikation bleiben Black-Box, aber der Umfassende Zyklus kann einschließlich Netz- und Userverhalten analysiert werden.
  • Oracle Application Diagnostics for Java (AD4J) Analysewerkzeug für Java-Applikationen. Fokus ist hier eine weitgehend vollständige Abdeckung aller komponenten: Java-Objekte / App-Server (herstellerunabhängig), und DB-Prozesse (herstellerspezifisch)
  • Oracle Enterprise Manager 10g Grid Control und SLM - mit den unterschiedlichen Packs und Plug-Ins

Gerade bei letzteren ist eine Option, durch Plug-Ins die Architektur so aufzubohren, dass auch echtes ITIL-Konformes SLM denkbar ist. Allerdings besteht ein derartiges Angebot noch nicht.

Wenn Oracle von SLM spricht, dann meinen sie vor allem das Bereitstellen von relevanten KPIs und Metrics, die jedoch der weiteren Auswertung bedürfen.

IBM Tivoli

Die Produktsuiten dieses Herstellers gehören sicher zu den umfangreichsten schlechthin. Alle bereiche des Systems Management werden abgedeckt. Zielkunden sind vor allem Data Center von Konzernen.

Als Einstieg sei verwiesen auf IBM Tivoli Service Level Advisor ... eine ausgiebige Besprechung übersteigt den hier gesetzten Rahmen.

BMC

BMC hat sich durch namhafte Produkte einen festen Namen im Bereich des Service Managements gemacht. Als Einstiegs-Verweis: BMC Service Level Management allerdings sind umfassende Produktfamilien unter dem Dach dieses Herstellers zu finden.

Oblicore

Oblicore ist ein Spezialanbieter, die sich vor allem auf SLM konzentriert hat. OBLICORE GUARANTEE wird seine Interessenten stärker bei den Kunden finden, die den Best-of-Breed Ansatz einer Integrierten Lösung vorziehen. zu nennen. Laut Forrester Research hätte diese einen unique Approach

FrontRange

FrontRange kommt von der Seite der CRM-Lösungen und beeindruckt ebenfalls mit beachtlichen Kundenzahlen. FrontRange SLMAllerdings ist die allgemein verfügbare Information über den details des SLM eher dünn.


Fortschreibung

Dieser Ansatz kann grundsätzlich nur partiell sein, da die Anforderungen und Tool-Angebote sehr umfangreich sind und sich ständig ändern. Für eine kostenlose Analyse ist dies sicher ein unerwartetes Ergebnis hier umfassend und aktuell zu bleiben. Falls sie aber besondere Fragen zu einem Tool haben, oder ein spezielles Tool vorschlagen wollen, dann wäre ich für Rückmeldungen dankbar, auch wenn ich nicht versprechen kann, dieses zeitnah zu bearbeiten. Falls sie bereits eine entsprechende Tool-Klassifizierung nach dem o.g. Raster mitliefern würden, wäre ich Ihnen verbunden und würde den Prozess erleichtern, diese hier aufzunehmen.