AdvancedITIL
Service-Support-Metriken
Incident-Management
Kapitel 5
Der Abschnitt des ITIL-Buches zum Service-Support, der sich mit dem Incident-Management befasst, bezeichnet Überwachung und Messung als Hauptindikatoren für die Leistung — Key Performance Indicators oder kurz KPI. ITIL definiert KPI folgendermaßen:
„Damit die Prozessleistung gemessen werden kann, sollten klar definierte Ziele mit messbaren Zielwerten gesetzt werden, die häufig als Key Performance Indicators, KPI, bezeichnet werden.“
Wenn Sie sich die von ITIL angeführten Beispiele ansehen, sollten Sie daran denken, dass sich diese nicht auf das Service-Desk beziehen, sondern auf das Incident-Management. Als Beispiele für die Wirksamkeit und Effizienz des Incident-Management-Prozesses nennt ITIL die folgenden Messzahlen:
- Gesamtzahl der Vorfälle
- Für die Problembehebung oder -umgehung erforderliche mittlere Zeitdauer, aufgeschlüsselt nach Wirkungscode
- Prozentsatz der innerhalb der vereinbarten Zeit abgewickelten Vorfälle (Ziele für die Reaktionszeit können in SLA zum Beispiel je nach Wirkungscode festgelegt werden)
- Durchschnittskosten je Vorfall
- Prozentsatz der Vorfälle, die vom Service-Desk ohne Einbeziehung anderer Support-Ebenen abgeschlossen wurden
- Anzahl der pro Service-Desk-Workstation bearbeiteten Vorfälle
- Anzahl und Prozentsatz der Vorfälle, die remote, ohne Technikerbesuch, abgewickelt wurden
Alle diese Messzahlen dienen eher der Leitung als der Bestätigung, dem Eingreifen oder der Rechtfertigung. Für einen Großteil dieser Messzahlen sind Ziele definiert.
Betrachten wir die Messzahlen nun genauer:
Gesamtzahl der Vorfälle: Die Gesamtzahl der Vorfälle ist an sich eine offenkundige Messzahl. Sie ist jedoch dann am nützlichsten, wenn der entsprechende Bericht diese Zahl über einen Zeitraum hinweg erfasst und nach Datum und Uhrzeit aufschlüsselt. Auch längere Zeiträume, zum Beispiel Monate oder Jahre, sind möglich.
Diese Berichte sollten jedoch auch Aufschlüsselungen enthalten, die Fluktuationen in der Arbeitsbelastung aufzeigen. Die Spitzenauslastungen sind besonders wichtig. Es kann zum Beispiel vorkommen, dass an einem bestimmten Wochentag immer mehr Arbeit anfällt als an anderen oder dass die höchsten Vorfallsraten immer in einem bestimmten Monat auftreten. Die Zahlen zur Spitzenauslastung sind bei der Personal- und Urlaubsplanung hilfreich.
Legen Sie für einzelne Zeiträume Zielwerte für die Kapazität fest und vergleichen Sie diese mit den tatsächlichen Zahlen, damit Sie die passende Mitarbeiterzahl bestimmen können. Wenn zum Beispiel pro Stunde maximal 200 Vorfälle abgewickelt werden können, wie oft nähert sich dann die tatsächliche Zahl diesem Höchstwert an? Wenn die tatsächliche Zahl nahe an der maximalen Kapazität liegt, sollten Sie eine spezielle Überwachung einrichten, also eingreifen oder rechtfertigen. Sie können proaktiv handeln, indem Sie vorausberechnen, wann Ihre Kapazität nicht mehr ausreichen wird.
- Indikator für die IT-Geschäfts-Abstimmung: Besprechen Sie die Arbeitslast mit Ihren wichtigsten Kunden und Partnern, damit Sie anhand des voraussichtlichen Unternehmenswachstums voraussagen können, wie sich die Anzahl der Vorfälle entwickeln wird.
Für die Problembehebung oder -umgehung erforderliche mittlere Zeitdauer, aufgeschlüsselt nach Wirkungscode: Die Bedeutung dieser Messzahl ist möglicherweise nicht unmittelbar erkennbar. Betrachten wir sie genauer. In ITIL werden die Begriffe „mittlere Zeit“ und „Durchschnittszeit“ häufig synonym verwendet. „Umgehungen“ werden häufig als „Workarounds“ bezeichnet und „Auswirkungen“ sind als „Maß für die unternehmerische Bedeutung eines Vorfalls“ definiert. Für die meisten von uns sind die „Auswirkungen“ jedoch der Code für die Schwere oder Priorität eines Vorfalls. Diese Messzahl betrifft also die durchschnittlich für die Behebung eines Vorfalls oder für einen Workaround erforderliche Zeit, aufgeschlüsselt nach dem Schwere- oder Prioritätscode. Sie ist nützlich, da sie hilft, den tatsächlichen Personalbedarf zu bestimmen. Wenn Sie zum Beispiel die Durchschnittszeiten für die einzelnen Schwere-/Prioritätenebenen sowie die Gesamtzahl der Vorfälle kennen, haben Sie damit auch die Daten, anhand derer Sie die zeitliche Verteilung der Arbeitslast ermitteln können. Wenn Sie aus jüngeren historischen Daten ersehen können, dass sich die Durchschnittszeit verändert hat, können Sie darüber hinaus auch die Auswirkungen auf die Arbeitslast berechnen, indem Sie die Wirkung auf die Mitarbeiterkapazität des Incident-Managements prognostizieren.
- Indikator für die IT-Geschäfts-Abstimmung: Führen Sie einen ständigen Dialog mit Ihren wichtigsten Kunden und Partnern, damit Sie sofort reagieren können, falls die Auswirkungscodes an Veränderungen der Geschäftsumgebung angepasst werden müssen.
Prozentsatz der innerhalb der vereinbarten Zeit abgewickelten Vorfälle (Ziele für die Reaktionszeit können in SLA zum Beispiel je nach Wirkungscode festgelegt werden): Auch dies ist eine wichtige Messzahl.
Noch wichtiger ist jedoch die Anzahl der Vorfälle, die nicht innerhalb der vereinbarten Reaktionszeit abgewickelt wurden. Jedes Mal, wenn ein Vorfall nicht innerhalb der vereinbarten SLA bearbeitet wird, haben Sie einen unzufriedenen Kunden. Untersuchen Sie diese Vorfälle, um herauszufinden, warum sie nicht innerhalb der vereinbarten Reaktionszeit abgewickelt wurden, und stellen Sie fest, mit welchen Maßnahmen Sie die Anzahl dieser Vorfälle senken können.
- Indikator für die IT-Geschäfts-Abstimmung: Die Manager des Geschäftsbetriebes sollten in der Lage sein, den Verlauf jedes einzelnen Vorfalls zu verfolgen, bei dem der vereinbarte Service-Level nicht eingehalten wurde. Benachrichtigen Sie die Manager automatisch, wenn die Behebung eines Vorfalls den vereinbarten Zeitrahmen überschreitet. Außerdem sollten die Business-Manager in der Lage sein, historische Daten zu diesen Vorfällen einzusehen.
Durchschnittskosten je Vorfall: Die Durchschnittskosten je Vorfall sind einfach zu errechnen und können für viele finanzielle Berechnungen verwendet werden, unter anderem für Ausgleichsbuchungen. Allerdings kann der Begriff „Durchschnittskosten“ irreführend sein. So kann zum Beispiel das Löschen eines Passwortes weniger als eine Minute in Anspruch nehmen und minimale Kosten verursachen, während die Beantwortung einer Frage im Rahmen des Just-in-Time-Trainings 30 Minuten dauert und wesentlich höhere Kosten verursacht. Daher sollten Sie auch die Durchschnittskosten je Vorfallsart berechnen.
- Indikator für die IT-Geschäfts-Abstimmung: Die Business-Manager sollten in der Lage sein, die Kosten von Vorfällen, die ihren Geschäftsbereich betreffen, einzusehen. Im Idealfall schlüsseln Sie diese Daten nach Kategorien wie zum Beispiel Datum oder Abteilung auf.
Prozentsatz der Vorfälle, die vom Service-Desk ohne Einbeziehung anderer Support-Ebenen abgeschlossen wurden: Diese häufig auch als „auf erster Ebene behobene Vorfälle“ bezeichnete Messzahl gehört zu den wichtigsten Messzahlen für Service-Desks. Normalerweise wird für die Behebung durch den First-Level-Support ein Zielwert definiert; einige SLA legen zudem Messzahlen dafür fest. Achten Sie darauf, dass diese Messzahl das Service-Desk nicht in eine falsche Richtung weist, indem sie etwa den Eindruck erweckt, dass es wichtiger ist, Vorfälle abzuschließen, als sie zu beheben.
- Indikator für die IT-Geschäfts-Abstimmung: Business-Manager bevorzugen die „Reduzierung der Vorfälle“ gegenüber der „Vorfallsbehebung durch den First-Level-Support“. Stellen Sie sicher, dass Sie mit Hilfe des Problem-Managements ein strukturiertes Verfahren entwickeln, um die Anzahl der Vorfälle zu senken. Geben Sie den Business-Managern Einblick in die Daten zur Vorfallsbehebung durch den First-Level-Support sowie in den Status der Vorfallsreduzierung durch das Problem-Management.
Anzahl der pro Service-Desk-Workstation bearbeiteten Vorfälle: Dies ist eine weitere klassische Messzahl für Service-Desks, mit der Personalkapazität und -leistung überwacht und gemessen werden.
Die Verarbeitung von Vorfällen muss so effizient wie möglich ablaufen. Aus diesem Grund ist dies eine wichtige Messzahl, mit der die Leistung des Incident-Management-Prozesses beobachtet werden kann. Im Idealfall sind die Vorfälle je Service-Desk-Workstation gleichmäßig verteilt. Ein Ungleichgewicht könnte ein Hinweis darauf sein, dass bei der Zuweisung von Vorfällen zu einzelnen Service-Desk-Workstations ein Problem besteht, das wahrscheinlich die Leistung beeinträchtigt. (Sofern das Ungleichgewicht nicht geplant ist. Zum Beispiel sind einige Workstations eventuell nur während der Hauptzeiten besetzt.) Jedes nicht geplante Ungleichgewicht muss untersucht und behoben werden.
- Indikator für die IT-Geschäfts-Abstimmung: Diese allgemeine Messzahl ist für Businees-Manager nicht interessant. Wenn ein Ungleichgewicht jedoch durch Business-Manager oder deren Mitarbeiter verursacht wird, müssen Sie diese hinzuziehen und die Ursache des Ungleichgewichts mit ihnen besprechen. Beispiele hierfür sind, dass Manager oder ihre Mitarbeiter anrufen und nach einem bestimmten Service-Desk-Mitarbeiter fragen oder dass auf einen Vorfall bezogene E-Mails direkt an einen bestimmten Mitarbeiter geschickt werden.
Anzahl und Prozentsatz der Vorfälle, die remote, ohne Technikerbesuch, abgewickelt wurden: Diese Messzahl gewinnt zunehmend an Bedeutung. Je mehr wissensbasierte Technologien eingesetzt werden, desto wichtiger wird diese Zahl und desto mehr wächst die Arbeitslast am Service-Desk an. Sie sollten unbedingt auch Daten erfassen, die zeigen, welche Tools für die Remote-Behebung von Vorfällen verwendet werden.
- Indikator für die IT-Geschäfts-Abstimmung: Arbeiten Sie bei allen Aspekten der Remote-Behebung von Vorfällen mit den Business-Managern zusammen. Manchmal ist es zum Beispiel billiger und geht schneller, das Service-Desk anzurufen. Die Business-Manager sollten in der Lage sein, alle Aktivitäten und Informationen mit Bezug auf die Remote-Behebung einzusehen: Wer sie nutzt, wie lange sie dauert und was sie kostet.
Wie bereits erwähnt, ist die Leitung der Grund für einen Großteil der Messung und Überwachung im Bereich des Incident-Managements. Bei einigen dieser Messzahlen kann jedoch ein Eingreifen oder Bestätigen erforderlich sein. Dies ist zum Beispiel dann der Fall, wenn die Service-Qualität abnimmt oder die Kosten steigen.
> > Kapitel 6 - Problem-Management