AdvancedITIL: 服務支援指標

服務支援指標

問題管理

第 6 章

「ITIL 服務支援」一書的「問題管理」小節從兩個觀點來檢視監控與評量:管理資訊,以及與「服務層級」比對的效能。我們首先討論管理資訊,然後探討「服務層級」。

對於管理資訊,請記得 ITIL 的「問題管理」目標如下:

「問題管理」的目標在於降低因 IT 基礎架構錯誤而引發的「意外」與「問題」對商務的負面衝擊,並避免相關錯誤所引發的「意外」重複發生。為了達到這個目標,「問題管理」旨在尋求「意外」的根本原因,然後採取動作來改善情況或更正錯誤。

ITIL 也指出應該從反應式與主動式的觀點來理解「問題管理」:

「問題管理」程序有反應與主動兩大面向。反應面向主要是關於因應一或多個「意外」來解決「問題」。「主動問題管理」則是關於在「意外」發生前,事先找出「問題」與「已知錯誤」並加以解決。

因此,多數的管理資訊指標並非以引導為目的,而是為了提供人員工作負載和 IT 品質的決策資訊。這些指標通常提供許多有用資訊,以用於證明主動式「問題管理」是否找到潛在弱點,以及/或是介入修改某項作法。ITIL 建議評量下列指標:

  • 提出的「變更要求」數目,以及這些「變更要求」對所涵蓋服務之可用性與可靠性的影響。
  • 每一組織單位投注在調查與診斷上的時間量,依「問題」類型劃分。
  • 在解決根本「問題」或確認「已知錯誤」前,發生意外的次數與影響。
  • 「問題管理」中立即 (反應式)支援努力與規劃支援努力的比例。
  • 與下列資源有關的未解決「問題」解決計劃:
    • 人員
    • 其他使用資源
    • 成本 (對照預算)
  • 要採取的動作之簡短說明。

視「問題」數量而定,這些指標可能會在任何指定時期內起伏波動。波動情形可能由種種因素造成,包括因建置新系統所產生的新「問題」、實施新服務、升級系統與服務、發生新變更,新軟體版本上線以及其他更新等。請記得此處的主要目標是要消除「問題」。比起早已建立 ITIL 的組織,剛建置 ITIL 的組織之資訊管理指標通常與目標值相去甚遠,因為前者的「問題」已經明顯減少。

讓我們個別查看每個指標:

提出的「變更要求」數目,以及這些「變更要求」對所涵蓋服務之可用性與可靠性的影響。此指標的第一部份要求因「問題管理」而提出的「變更要求」(RFC) 數目,而且只是單純作為指引。第二部份則有所不同,且需要雖相似、但不同的指標。此說明雖提及影響,但是並未指出它是自上次報告以來提出的新 RFC 之影響 (潛在影響),或是從上次報告以來所建置的 RFC 之結果。若假定影響同時包括這兩者,則需要針對上次報告以來的 RFC 產生證明評量,並針對上次報告以來實施的變更產生驗證評量。

對於從上次報告迄今由於「問題管理」導致的變更,並沒有定義 RFC 證明評量中預測的影響以及從驗證取得的實際結果兩者之間的差異。評量已建置的 RFC。此分析可讓我們更加瞭解由於「問題管理」而實施的變更之影響,例如,倘若證明原始 RFC 的基礎是「服務中心」每天收到的「意外」數會減少 50 個,而驗證結果指出每天收到的「意外」數只減少 30 個,則或許應該重新檢討證明的方法。

  • 商業協調指標 – 對於任何已提交且將影響對服務的可用性與可靠性的影響之任何 RFC,必須可讓客戶收到或在線上檢閱與這些 RFC 相關的定期報表和更新。此外,應該徵詢客戶對 RFC 驗證與證明的建議與意見。

每一組織單位或供應商投注在調查與診斷上的所需時間,依「問題」類型劃分。經理和專案召集人可使用此指標,瞭解其員工投注在尋找「問題」根本原因的時間與努力有多少。此資料對經理和專案召集人而言相當重要,因為它有助於更妥善地管理目前和未來的人員工作負載,並提供可用於計算投入特定 RFC 之人事成本的基本資料。

  • 商業協調指標 – 商業經理需要查看此報表,請記得完整納入曾協助調查與診斷的商務社群成員所花費的時間。

在解決根本「問題」或確認「已知錯誤」前,發生「意外」的次數與影響。在進一步檢視評量指標之前,最好先釐清一點:ITIL 指出當發生新的「意外」時,應開啟一個「問題」記錄,每當發生與「問題」相關的新「意外」時,應更新「問題」記錄,且「問題」記錄中的「意外」欄位應遞增 1。此資料非常重要,因為「意外」數量與影響程度可能會更改「問題」的優先順序。例如,若某個「問題」每天只發生兩個「意外」且對商務的影響不大,則很可能會指派低優先順序給該「問題」。不過,若「意外」數突然增加到每天 50 個,則「問題」的優先順序也會隨著提高。同理,若某個「問題」每天只發生兩個「意外」,但是對商務的影響很大,則可能會被指派高優先順序。

這是需要完全整合「意外管理」和「問題管理」技術的重要報表,且應將此報表傳送給所有 IT 經理。

  • 商業協調指標 – 這個報告對業務經理亦非常重要,所指的是那些對於需要知道「問題」的數量及其對個別商業領域之影響的商業經理而言,此報表也非常重要,商業經理需要確認是否符合他們指定的優先順序。理想上,商業經理應可在線上查看此報表,並在發生任何影響其商業領域的新「問題」時立即收到通知。

「問題管理」中立即 (反應式)提供支援的與規劃支援所花的努力的比例。接下來回到工作負載的課題上,但是以更為結構化的方式來探討。ITIL 建議所有支援小組均配置一段「問題管理」工作時間,以確保有時間進行「問題」排除。通常,這段時間包含分配給主動式活動和反應式活動的時間。遺憾的是,IT 運作模式的本質通常與此建議相衝突,例如,IT 人員需要立即處理無法解決的「意外」,直到找出根本原因並執行永久解決方案為止。此報表可讓 IT 經理檢閱立即支援與規劃支援的比例,以便改善未來的工作負載規劃。

  • 商業協調指標 – 一開始您可能以為商業經理不會對此報表感興趣,不過,若商業經理付費取得支援,例如透過成本分攤機制,則會對此報表有高度興趣。商業經理應當收到這份報表,且盡可能提供線上檢閱方式。

與資源、人員、其他使用資源和成本 (對照預算) 有關的未解決「問題」解決計劃。此報表為所有 IT 部門必要的報表,不過只有當已經擬定「問題」管理的預算,且存在產生報表的技術時,才能建立此報表,它是具有重要價值的規劃文件。

  • 商業協調指標 – 基於成本因素,商業經理需要這份報表。此外,此指標中所列的「人員和其他使用資源」可能包含來自商業部門的人員和資源。商業經理應當收到這份報表,且最好可在線上檢閱。

簡短說明要採取的動作。此報表應作為參考資料並可供管理人員於線上存取,因為報表可能很長,需要相當多時間才能讀完全部。例如,假設有 50 個「問題」未解決,則會有 50 個要採取的動作之說明。對於其他針對「問題管理」產生的管理報表中所標明的「問題」,管理層只會對其中一、兩個「問題」的執行動作有興趣。

  • 商業協調指標 – 若商業經理有收到其他報表,那麼也應該收到這份報表—且最好透過線上方式。

上述管理資訊報表相當重要,因為它們提供適合管理階層的高層觀點,並提供重要規劃資料,特別是在支援人員工作負載這方面。不過,若要行使對「問題管理」的控制權,還需要 ITIL 所建議的其他更詳盡報表:

  • 問題和錯誤的數目,依下列項目劃分:
    • 狀態
    • 服務
    • 影響
    • 類別
    • 使用者/商業群組
  • 已結束問題的總耗用時間。
  • 未解決問題迄今耗用時間。
  • 從發出「問題」記錄到結束「問題」或確認「已知錯誤」的平均和最大耗用時間,依影響代碼和支援小組細分 (包括廠商)。
  • 任何暫時解決動作。
  • 未解決問題的預期解決時間。

若您具有所需的技術,便可從「問題管理」產生此份可用報表清單。深入查看這些報表將可提供額外的見解:

問題和錯誤的數目,依下列項目劃分:狀態、服務、影響、類別和使用者/商業群組。雖然此報表只提供整體數字,不過仍然有用,因為它將「問題」區分為不同類別。上述類別僅供參考,請隨意新增任何其他最符合您組織需求的類別,例如技術或廠商。召開由「服務管理」人員和不同「支援小組」代表參與的「問題管理」會議時,此報表也可提供有用資料。

  • 商業協調指標 – 雖然商務社群對多數這些類別不感興趣,但「使用者/商業群組」具有相關性所以應提供報表給資深商業經理。洽詢商業經理的意見,瞭解是否有其他需要的類別。

已結束問題的總耗用時間。我們必須假定此報表列出自上次報告或上一期間以來所有已結束的「問題」,且報表中顯示每個已結束「問題」的總耗用時間,並於結尾處提供摘要總計。此資料有助於未來的工作負載規劃。

  • 商業協調指標 – 此報表應提供給商業經理,作為檢查耗用時間的「例外報表」。

未解決問題迄今耗用時間。此報表與上一個報表類似,但列出的是未解決「問題」的耗用時間狀態,而非已結束「問題」的狀態。此報表顯示所有未解決「問題」的總耗用時間,並於結尾處提供摘要總計。此資料有助於未來的工作負載規劃。

  • 商業協調指標 – 此報表應提供給商業經理,作為檢查耗用時間的「例外報表」。若商業經理認為時間浪費在對商務並不重要的「問題」上,則應該介入處理。

從發出「問題」記錄到結束「問題」或確認「已知錯誤」的平均和最大耗用時間,依影響代碼和支援小組細分 (包括廠商)。平均和最大耗用時間雖然有用,但可能也具誤導性。使用此資料時請非常小心,務必不要單以此資料作為未來人員工作負載規劃的決策參考。

  • 商業協調指標 – 這比較像是警告,而非協調陳述。請小心不要讓商業經理誤解此資料,以為平均時間適用於其特定「問題」。

您可選擇不將此報表發送給商業經理,若您決定發送,請務必註明這些是基本規劃指標,而非承諾。 任何暫時解決動作。暫時解決動作—例如已於何時安裝「修補程式」來排除「意外」,但這不是正式或核准的解決方案—也稱為「規避」。此報表相當重要,因為一旦已對「問題」套用暫時解決方案,支援小組可能會偏向忽略「問題」,而不會繼續尋找並安裝核准的永久解決方案。此報表應發送給所有服務與支援小組管理者,以確保不會使用暫時動作來代替核准的解決方案。在證明或建置新軟體版本時,此報表尤其重要。例如,能夠消除的暫時解決方案數目可作為建置新版軟體的重要理由。同理,此報告也可用於確保將所有適當的暫時解決方案套用至新版本。

  • 商業協調指標 - 商業經理是否需要知道暫時解決方案是具有爭議性的問題,多數情況下,若修補程式可協助避開「問題」,那麼他們其實不在乎是否有其他永久修復方案。不過,倘若他們提供經費,便可能希望看到此報表。

未解決問題的預期解決時間。預期解決時間會包含在為每個「問題」準備的證明報表中。「問題」擁有者應可檢閱每個未解決「問題」的狀態,以計算預期的解決時間。此報表對服務與支援小組管理者而言相當重要,因為它有助於規劃短期工作負載。

  • 商業協調指標 - 下列任一情況為真時,商業經理只會於下列情況時,才會想要查看這份報表:他們是工作負載的付費者、他們有快速追蹤「問題」的迫切需求、他們提供部份工作負載,或者他們是 IT 規劃的參與者。否則,商業經理一般不會對此報表有興趣。

雖然您可精確規劃 IT 的許多面向,但是無法準確計劃「問題」及其影響。然而,「問題管理」報表可協助組織提昇「問題」處理能力。

> > 第 7 章 - 變更管理