AdvancedITIL

Service-Support-Metriken

Problem-Management

Kapitel 6

Der Abschnitt des ITIL-Buches zum Service-Support, der sich mit dem Problem-Management befasst, untersucht die Messung und Überwachung unter zwei Gesichtspunkten: Managementinformationen und -leistung im Verhältnis zu Service-Levels. Wir besprechen zuerst die Managementinformationen und anschließend die Service-Level.

Denken Sie bei den Managementinformationen an das ITIL-Ziel für das Problem-Management:

„Das Ziel des Problem-Managements besteht darin, die negativen Auswirkungen von Vorfällen und Problemen, die durch Fehler in der IT-Infrastruktur verursacht werden, auf den Geschäftsbetrieb zu minimieren sowie das erneute Auftreten derartiger Vorfälle zu vermeiden. Um dieses Ziel zu erreichen, versucht das Problem-Management die Ursache von Vorfällen zu ermitteln und Maßnahmen zur Verbesserung oder Bereinigung der Situation einzuleiten.“

ITIL stellt außerdem fest, dass es ein reaktives und ein proaktives Problem-Management gibt:

„Der Problem-Management-Prozess hat einen reaktiven und einen proaktiven Aspekt. Der reaktive Aspekt betrifft die Lösung von Problemen in Folge eines oder mehrerer Vorfälle. Das proaktive Problem-Management identifiziert und löst Probleme und bekannte Fehler, bevor Vorfälle auftreten.“

Die meisten Messzahlen für Managementinformationen dienen der Leitung nicht direkt, sondern liefern Informationen für Entscheidungen über die Personalauslastung und die IT-Qualität. Diese Messzahlen liefern häufig nützliche Informationen für die Rechtfertigung, falls das proaktive Problem-Management potenzielle Schwächen feststellt, und/oder für ein Eingreifen, das die Vorgehensweise ändert. ITIL schlägt die Messung der folgenden Werte vor:

  • Anzahl der eingegangenen Änderungsanfragen und Auswirkungen dieser Änderungsanfragen auf die Verfügbarkeit und Zuverlässigkeit der betroffenen Services
  • Pro Organisationseinheit oder Lieferant in Untersuchungen und Diagnosen investierte Zeit, aufgeschlüsselt nach Problemarten
  • Häufigkeit und Auswirkungen eines Vorfalls, bevor das zugrunde liegende Problem gelöst oder ein bekannter Fehler bestätigt wird
  • Verhältnis der direkten (reaktiven) Support-Arbeit zur geplanten Support-Arbeit im Problem-Management
  • Pläne für die Lösung offener Probleme, soweit sie folgende Ressourcen betreffen:
    • Personal
    • Andere verwendete Ressourcen
    • Kosten (im Verhältnis zum Budget)
  • Kurze Beschreibung geplanter Maßnahmen

Diese Messzahlen können sich, je nach der Menge der Probleme, im Laufe eines gegebenen Zeitraumes verändern. Als Ursache dieser Fluktuation kommen verschiedene Faktoren in Frage. Neue Probleme können zum Beispiel durch die Implementierung neuer Systeme oder Services, die Aufrüstung von Systemen, den Ausbau von Services, neue Änderungen, neue Softwareversionen oder andere Aktualisierungen verursacht werden. Denken Sie daran, dass das Ziel darin besteht, Probleme zu beheben. Bei Unternehmen, die ITIL gerade erst implementieren, ist die Differenz zwischen den Messwerten und den Zielwerten für Managementinformationen normalerweise größer als bei Unternehmen, die schon seit einiger Zeit mit ITIL arbeiten und die Anzahl der Probleme bereits spürbar verringert haben.

Betrachten wir die einzelnen Messwerte genauer:

Anzahl der eingegangenen Änderungsanfragen und Auswirkungen dieser Änderungsanfragen auf die Verfügbarkeit und Zuverlässigkeit der betroffenen Services: Der erste Teil dieser Messzahl betrifft die Anzahl der Änderungsanfragen, die über das Problem-Management eingegangen sind, und ist relativ einfach zu steuern. Der zweite Teil sieht etwas anders aus und erfordert andere, wenn auch ähnliche Messzahlen. Hier ist von Auswirkungen die Rede, wobei jedoch nicht gesagt wird, ob die (potenziellen) Auswirkungen von Änderungsanfragen, die seit dem letzten Bericht eingegangen sind, gemeint sind oder die Auswirkungen von Änderungsanfragen, die seit dem letzten Bericht in Änderungen umgesetzt wurden. Wenn wir davon ausgehen, dass beide Arten von Auswirkungen gemeint sind, müssen wir für die seit dem letzten Bericht eingegangenen Änderungsanfragen Rechtfertigungs-Messungen und für die seit dem letzten Bericht implementierten Änderungen Bestätigungs-Messungen vornehmen. Hinsichtlich der Änderungen, die auf Veranlassung des Problem-Managements seit dem letzten Bericht eingeführt wurden, ist ein Bereich nicht definiert, nämlich der Unterschied zwischen den in den Rechtfertigungs-Messungen für Änderungsanfragen prognostizierten Auswirkungen und den tatsächlichen Ergebnissen, die wir durch die Bestätigungs-Messungen für implementierte Änderungsanfragen erhalten.

Diese Analyse vermittelt uns ein besseres Verständnis der Auswirkungen von Änderungen, die als Ergebnis des Problem-Managements implementiert wurden. Zum Beispiel: Wenn die ursprünglichen Änderungsanfragen unter der Annahme gerechtfertigt wurden, dass die Anzahl der Vorfälle pro Tag um 50 reduziert wird, die Bestätigung aber ergibt, dass tatsächlich nur eine Reduzierung um 30 Vorfälle pro Tag vorliegt, dann sollten wir unser Rechtfertigungs-Verfahren überprüfen.

  • Indikator für die IT-Geschäfts-Abstimmung: Die Kunden müssen (online oder ausgedruckt) regelmäßig Berichte und Aktualisierungen zu allen eingegangenen Änderungsanfragen erhalten, die sich auf die Verfügbarkeit und Zuverlässigkeit ihrer Services auswirken könnten. Sie sollten außerdem um ihre Meinung und Vorschläge zu den Bestätigungs- und Rechtfertigungs- Messungen für Änderungsanfragen gebeten werden.

Pro Organisationseinheit oder Lieferant in Untersuchungen und Diagnosen investierte Zeit, aufgeschlüsselt nach Problemarten: Mit dieser Messung können Manager und Projektleiter feststellen, wie viel Zeit und Arbeit ihre Mitarbeiter in die Suche nach Problemursachen investiert haben. Für Manager und Projektleiter sind diese Daten wichtig, da sie ihnen helfen können, die derzeitige und künftige Personalauslastung besser zu verwalten. Außerdem sind dies die grundlegenden Daten, anhand derer die Kosten für das Personal berechnet werden, das bestimmte Änderungsanfragen bearbeitet.

  • Indikator für die IT-Geschäfts-Abstimmung: Business-Manager müssen diesen Bericht erhalten. Vergessen Sie nicht, die Zeit festzuhalten, die Mitarbeiter des Geschäftsbetriebes in die Untersuchung und Diagnose investiert haben.

Häufigkeit und Auswirkungen eines Vorfalls, bevor das zugrunde liegende Problem gelöst oder ein bekannter Fehler bestätigt wird: Bevor wir diese Messung genauer betrachten, sollten wir einen Punkt klären. ITIL empfiehlt, einen neuen Problemdatensatz anzulegen, sobald ein neuer Vorfall auftritt. Jedes Mal, wenn in Zusammenhang mit diesem Problem ein neuer Vorfall auftritt, sollte der Problemdatensatz aktualisiert und die Zahl im Vorfallsfeld um eins erhöht werden. Diese Information ist sehr wichtig, da die Anzahl der Vorfälle und Auswirkungen die Priorität des Problems ändern kann. Zum Beispiel wird einem Problem mit nur zwei Vorfällen pro Tag und geringen Auswirkungen auf den Geschäftsbetrieb wahrscheinlich eine niedrige Priorität zugewiesen. Fallen jedoch plötzlich 50 Vorfälle pro Tag mehr an, so wird dem Problem eine entsprechend höhere Priorität zugewiesen. Auch ein Problem mit nur zwei Vorfällen pro Tag, aber weitreichenden unternehmerischen Auswirkungen kann eine hohe Priorität haben.

Für diesen wichtigen Bericht ist es erforderlich, dass die Technologien des Incident- und des Problem-Managements vollständig ineinander integriert sind. Der Bericht sollte an alle IT-Manager verteilt werden.

  • Indikator für die IT-Geschäfts-Abstimmung: Dieser Bericht ist auch für die Business-Manager wichtig, die die Anzahl der Probleme sowie die Auswirkungen dieser Probleme auf ihre jeweiligen Geschäftsbereiche kennen müssen. Die Business-Manager müssen sicherstellen, dass ihre Prioritäten erfüllt werden. Im Idealfall steht ihnen dieser Bericht online zur Verfügung und sie werden sofort benachrichtigt, wenn ein neues Problem festgestellt wird, das sich auf ihren Geschäftsbereich auswirkt.

Verhältnis der direkten (reaktiven) Support-Arbeit zur geplanten Support-Arbeit im Problem-Management: Bei diesem Punkt geht es wieder um die Arbeitslast, allerdings auf strukturiertere Weise. ITIL empfiehlt, dass alle Support-Gruppen eine bestimmte Zeit für das Problem-Management reservieren, damit diese Zeit für die Problembehebung zur Verfügung steht. Normalerweise wird dabei sowohl für proaktive als auch für reaktive Maßnahmen Zeit reserviert. Leider liegt es in der Natur der IT, dass ihre Arbeitsweise häufig nicht mit dieser Empfehlung vereinbar ist. Zum Beispiel beginnt das IT-Personal normalerweise sofort mit der Behebung eines Vorfalls, auch wenn dieser erst behoben werden kann, nachdem das zugrunde liegende Problem gefunden und eine dauerhafte Lösung implementiert wurde. Anhand dieses Berichtes können IT-Manager das Verhältnis des sofortigen zum geplanten Support untersuchen und die künftige Arbeitslast besser planen.

  • Indikator für die IT-Geschäfts-Abstimmung: Oberflächlich betrachtet, scheint dieser Bericht für Business-Manager uninteressant zu sein. Wenn diese Manager jedoch für den Support bezahlen, zum Beispiel in Form von Ausgleichsbuchungen, ist dieser Bericht sogar sehr wichtig für sie. Diesen Bericht sollten alle Business-Manager erhalten. Nach Möglichkeit sollte er online zur Verfügung gestellt werden.

Pläne für die Lösung offener Probleme, soweit sie folgende Ressourcen betreffen: Personal, andere verwendete Ressourcen und Kosten (im Verhältnis zum Budget): Dieser Bericht ist für alle IT-Abteilungen Pflicht. Er kann jedoch nur erstellt werden, wenn ein Etat für das Problem-Management eingerichtet wurde und die Abteilung über die notwendige Technologie verfügt, um den Bericht zu generieren. Als Planungsdokument ist dieser Bericht von größter Bedeutung.

  • Indikator für die IT-Geschäfts-Abstimmung: Die Business-Manager benötigen diesen Bericht wegen des Kostenelementes. Außerdem kann der in dieser Messzahl genannte Faktor „Personal und andere Ressourcen“ auch Personen und Ressourcen aus dem Geschäftsbetrieb einschließen. Diesen Bericht sollten alle Business-Manager erhalten. Nach Möglichkeit sollte er online zur Verfügung gestellt werden.

Kurze Beschreibung geplanter Maßnahmen: Dieser Bericht sollte als Referenz verwendet und dem Management online zur Verfügung gestellt werden, da er relativ lang ausfallen kann. Wenn zum Beispiel 50 offene Probleme bestehen, enthält der Bericht 50 Beschreibungen von Maßnahmen, die ergriffen werden müssen. Die Manager sind jedoch jeweils nur an den Maßnahmen zur Behebung einzelner Probleme interessiert, die in den übrigen Berichten des Problem-Managements detailliert dargestellt werden.

  • Indikator für die IT-Geschäfts-Abstimmung: Wenn die Business-Manager die übrigen Berichte erhalten, sollten sie auch diesen erhalten, nach Möglichkeit online. Die oben genannten Informationsberichte für das Management sind wichtig, da sie dem Management eine Sicht auf hoher Abstraktionsebene liefern. Darüber hinaus enthalten sie wichtige Planungsdaten, insbesondere zur Arbeitslast der Support-Mitarbeiter. Um das Problem-Management steuern zu können, benötigen wir jedoch detailliertere Informationen, wie ITIL sie vorschlägt:
  • Anzahl der Probleme und Fehler, aufgeschlüsselt nach:
    • Status
    • Service
    • Auswirkungen
    • Kategorie
    • Benutzergruppe/Geschäftseinheit
  • Gesamtdauer abgeschlossener Probleme
  • Bisherige Gesamtdauer offener Probleme
  • Durchschnittliche und längste Zeitdauer von der Erstellung des Problemdatensatzes bis zum Abschluss des Problems oder zur Bestätigung eines bekannten Fehlers, aufgeschlüsselt nach Wirkungscode und Support-Gruppe (einschließlich der Hersteller)
  • Alle vorläufigen Lösungsmaßnahmen
  • Erwartete Dauer bis zur Behebung offener Probleme

Alle Berichte kann das Problem-Management erstellen, sofern die dafür erforderliche Technologie vorhanden ist. Betrachten wir diese Berichte nun genauer:

Anzahl der Probleme und Fehler, aufgeschlüsselt nach: Status, Service, Auswirkungen, Kategorie und Benutzergruppe/Geschäftseinheit: Dieser Bericht liefert zwar nur allgemeine Zahlen, ist aber dennoch nützlich, da er die Probleme in Kategorien einordnet.

Die genannten Kategorien sind lediglich Vorschläge. Sie können jederzeit weitere Kategorien hinzufügen, die für Ihr Unternehmen interessant sind, zum Beispiel „Technologie“ oder „Hersteller“. Dieser Bericht enthält nützliche Daten für Besprechungen zum Problem-Management, an denen Mitarbeiter des Service-Managements und verschiedener Support-Gruppen teilnehmen.

  • Indikator für die IT-Geschäfts-Abstimmung: Die meisten dieser Kategorien sind für den Geschäftsbetrieb uninteressant. Eine Ausnahme ist die Kategorie „Benutzergruppe/Geschäftseinheit“, die leitenden Business-Managern zur Verfügung gestellt werden sollte. Fragen Sie die Business-Manager, ob sie an weiteren Kategorien interessiert sind.

Gesamtdauer abgeschlossener Probleme: Wir gehen davon aus, dass dieser Bericht alle seit dem letzten Bericht oder Zeitraum abgeschlossenen Probleme enthält, dass er die für die Behebung der einzelnen Probleme benötigte Zeit angibt und am Ende einen Gesamtwert nennt. Diese Daten sind bei der Planung der künftigen Arbeitslast hilfreich.

  • Indikator für die IT-Geschäfts-Abstimmung: Dieser Bericht sollte allen Business-Managern als ein „Ausnahmenbericht“ zur Verfügung gestellt werden, dem sie die für die Behebung einzelner Probleme erforderliche Zeit entnehmen können.

Bisherige Gesamtdauer offener Probleme: Dieser Bericht gleicht dem vorherigen. Die Zeitangaben beziehen sich jedoch nicht auf abgeschlossene, sondern auf offene Probleme. Der Bericht nennt für alle offenen Probleme jeweils die insgesamt investierte Zeit und am Ende einen Gesamtwert. Diese Information ist bei der Planung der künftigen Arbeitslast hilfreich.

  • Indikator für die IT-Geschäfts-Abstimmung: Dieser Bericht sollte allen Business-Managern als ein „Ausnahmenbericht“ zur Verfügung gestellt werden, dem sie die für die Behebung einzelner Probleme erforderliche Zeit entnehmen können. Die Business-Manager sollten eingreifen, wenn sie der Meinung sind, dass zu viel Zeit in Probleme investiert wird, die für den Geschäftsbetrieb nicht wichtig sind.

Durchschnittliche und längste Zeitdauer von der Erstellung des Problemdatensatzes bis zum Abschluss des Problems oder zur Bestätigung eines bekannten Fehlers, aufgeschlüsselt nach Wirkungscode und Support-Gruppe (einschließlich der Hersteller): Durchschnittsund Höchstzeit sind wichtig, können jedoch auch irreführen. Auf keinen Fall sollten Sie Entscheidungen über die künftige Arbeitslast des Personals allein anhand dieser Daten treffen.

  • Indikator für die IT-Geschäfts-Abstimmung: Dies ist eher eine Warnung als eine Aussage zur Abstimmung. Achten Sie darauf, dass die Business-Manager diese Daten nicht falsch interpretieren und annehmen, dass sich die Durchschnittszeit auf ihre speziellen Probleme bezieht. Eventuell beschließen Sie, diesen Bericht nicht an die Business-Manager weiterzuleiten. Falls Sie ihn jedoch weiterleiten, sollten Sie die Business-Manager darauf hinweisen, dass es sich bei den Daten lediglich um Planwerte handelt.

Alle vorläufigen Lösungsmaßnahmen: Vorläufige Lösungsmaßnahmen werden auch als Umgehung oder Workaround bezeichnet. Ein Beispiel hierfür ist ein Patch, der zur Behebung eines Vorfalles installiert wurde, aber keine formelle oder genehmigte Lösung darstellt. Dieser Bericht ist wichtig, denn wenn für ein Problem erst einmal eine vorläufige Lösung gefunden wurde, könnte das Support-Team versucht sein, das Problem zu ignorieren, statt nach einer dauerhaften Lösung zu suchen, sie genehmigen zu lassen und zu installieren. Dieser Bericht sollte allen Managern von Service- und Support-Gruppen zur Verfügung gestellt werden, damit sie darauf achten, dass tatsächlich genehmigte Lösungen und nicht nur vorläufige Maßnahmen installiert werden. Dieser Bericht ist insbesondere dann wichtig, wenn neue Softwareversionen gerechtfertigt oder implementiert werden. Eine wesentliche Rechtfertigung für die Implementierung einer neuen Softwareversion könnte zum Beispiel die Anzahl der vorläufigen Lösungen sein, die dadurch beseitigt würden. Außerdem kann mit Hilfe dieses Berichtes gewährleistet werden, dass alle geeigneten vorläufigen Lösungen auf die neue Version übertragen werden.

  • Indikator für die IT-Geschäfts-Abstimmung: Man kann darüber streiten, ob Business-Manager über vorläufige Lösungen Bescheid wissen müssen. Meist sind sie nicht mehr an dauerhaften Lösungen interessiert, sobald ein Problem mit einem Patch umgangen werden kann. Wenn sie allerdings für die Finanzierung zuständig sind, könnte sie dieser Bericht durchaus interessieren.

Erwartete Dauer bis zur Behebung offener Probleme: Die vermutliche Dauer bis zur Problembehebung sollte bei jedem Problem Bestandteil des Rechtfertigungsberichtes sein. Der Problemeigentümer sollte in der Lage sein, anhand des Status eines offenen Problems die voraussichtlich für die Problembehebung erforderliche Zeit zu berechnen. Dieser Bericht ist für Manager von Service- und Support-Gruppen wichtig, da er ihnen helfen kann, die kurzfristige Arbeitslast zu planen.

  • Indikator für die IT-Geschäfts-Abstimmung: Business-Manager sind nur an diesem Bericht interessiert, wenn sie für die Arbeitslast bezahlen, wenn es für sie wichtig ist, dass das Problem schnell beseitigt wird, wenn sie einen Teil der Arbeitslast tragen oder an der IT-Planung beteiligt sind. Ansonsten haben Business-Manager in der Regel kein Interesse an diesem Bericht.

Im Gegensatz zu vielen anderen Aspekten der IT können Sie Probleme und ihre Auswirkungen nicht genau planen. Die Berichte des Problem-Managements können Ihrer Organisation allerdings helfen, die Abwicklung von Problemen zu verbessern.

> > Kapitel 7 - Change-Management