5 millors pràctiques per automatitzar la gestió d’incidents importants

Autora: Roger Morrison
Data De La Creació: 27 Setembre 2021
Data D’Actualització: 1 Juliol 2024
Anonim
5 millors pràctiques per automatitzar la gestió d’incidents importants - Tecnologia
5 millors pràctiques per automatitzar la gestió d’incidents importants - Tecnologia

Content



Font: Pixtum / iStockphoto

Emportar:

Amb una estratègia d’automatització intel·ligent, podeu fer que la resposta a incidents sigui més ràpida i fàcil que mai, minimitzant els temps d’aturada i possibles incompliments de seguretat.

Els incidents informàtics importants es produeixen a les empreses cada dia. Tot i que només un bon grapat fa que els titulars, esdeveniments com a interrupcions i incompliments de seguretat poden paralitzar greument la productivitat dels empleats, influir negativament en les percepcions dels clients i, el que és més important, produir ingressos perduts.

Així, quan es tracta de gestionar grans incidències informàtiques, el millor és centrar-se en l’impacte empresarial i la línia de fons. Segons l'Institut Ponemon, el cost mitjà dels temps morts el 2016 va ser de 8.851 dòlars el minut, que supera els 500.000 dòlars per hora, i els temps d'inactivitat típics superen els 90 minuts. I aquest és només el cost immediat. L’impacte a llarg termini, com ara danys de reputació i atracció de clients, són imprevisibles i potencialment catastròfiques.


Si bé no podeu evitar del tot els incidents principals, podeu fer que la vostra organització estigui el més preparada possible per afrontar-los quan es produeixin. I un component important de la vostra estratègia hauria de ser incorporar automatització. Les organitzacions que maximitzen l’ús de l’automatització en els seus principals processos de resolució d’incidents aconsegueixen una restauració més ràpida del servei i molts menys errors a causa d’un error humà. Això és degut a que l’automatització repercuteix directament en la capacitat de reduir la durada de la finestra d’impacte empresarial, o en aquest costós període en què els usuaris i les operacions empresarials senten efectivament l’impacte d’un incident. (Per obtenir més informació sobre l’automatització, vegeu Automatització: el futur de la ciència de dades i l’aprenentatge automàtic?)

Per maximitzar els avantatges de l’automatització, heu d’examinar quines són les activitats que s’han de dur a terme durant la finestra d’impacte i esbrinar com traslladar totes les altres activitats cap a l’inici o l’inici de l’activitat després que el negoci torni a les operacions normals. Aquí teniu cinc maneres útils per començar.


1. Desenvolupar i definir un procés

Definir un procés important de gestió d’incidents consisteix a identificar què es pot planificar, coordinar o executar durant un incident. Això pot suposar identificar els membres de l’equip d'assistència clau per competències i horaris, per exemple, de manera que el servei de servei els pugui implicar el més ràpidament i eficaçment possible. També significa esbrinar com transmetreu informació rellevant al vostre equip perquè puguin començar a resoldre el problema de forma immediata, així com mantenir informats i actualitzats els interessats adequats.

L’automatització és fonamental per a aspectes clau d’aquest procés. Per exemple, podeu automatitzar la inclusió d’informació rellevant de les vostres eines de control als tiquets del taulell de servei o incloure informació del servei d’atenció a les notificacions als resoledors d’incidents. També podeu documentar tot l’incident a una única font de veritat completa accessible per a tots. Recordeu que podeu practicar aquest procés per solucionar-lo correctament, no heu d'esperar que es produeixi un incident real per provar el vostre plantejament.

2. Tingueu en compte la vostra infraestructura

En aquest dia i en una època de fatiga alerta, és fonamental que no continuïu a bombardejar els vostres equips amb notificacions i informació irrellevants que no els siguin aplicables. L’aplicació de filtres a les vostres alertes de monitoratge permetrà als vostres equips entrar a l’agulla més fàcilment a l’altura del soroll rutinari. Això és clau per fer que tots els vostres coneixements i dades siguin realment actuables, en lloc d’afegir-los a la sobrecàrrega d’informació.

Les bones maneres d’automatitzar-se inclouen l’ús d’una solució APM per rastrejar totes les aplicacions i sistemes per identificar de manera proactiva les causes arrels en el punt de qualsevol degradació del rendiment abans de provocar majors interrupcions del servei. També podeu integrar el vostre monitoratge, el servei de servei, les aplicacions de col·laboració i les eines de xat per compartir informació simultània en temps real.

Sense errors, sense estrès: la vostra guia pas a pas per crear programes que canvien la vida sense destruir la vida

No podeu millorar les vostres habilitats de programació quan ningú es preocupa per la qualitat del programari.

3. Mesureu exactament MTTR

Com es mesura el temps mitjà per reparar (MTTR)? Es basa en el temps total en què es dediquen els equips informàtics o en el temps total en què el negoci està realment afectat? Si la resposta és la anterior, hauríeu de replantejar-vos la mesura de la finestra d’impacte mitjançant la perspectiva empresarial. Aquesta opció és molt més precisa per fer els vostres esforços d’optimització, perquè el vostre objectiu és minimitzar l’impacte d’incidents, i no simplement presentar informes de resposta millors al vostre consell. (Per obtenir més informació sobre els temps d'inactivitat i sobre com es gestiona, consulteu el temps mitjà entre els fracassos que realment significa.)

Podeu automatitzar-vos proporcionant una visibilitat completa a les aplicacions per "activar el rellotge" amb caràcter retroactiu si cal, i conservar un registre complet de les vostres activitats de resolució i comunicacions per a anàlisis i auditories per millorar els vostres processos.

4. Mantingueu informats els interessats, però sense interrompre la resolució

Els interessats esperen que les comunicacions siguin efectives i oportunes i esperen que els experts en matèries es concentren làser en la resolució de problemes. Si bé es pot designar un punt de contacte de comunicacions per supervisar i involucrar usuaris de negocis, una estratègia més eficaç seria crear una pàgina web d’autoservei amb actualitzacions d’estat. D’aquesta manera, l’interessat pot comprovar-se per si mateix sense bombardejar el vostre equip amb altres trucades. Si us plau, recordeu que actualitzeu periòdicament els vostres grups d'interès perquè sempre rebin i sàpiguen esperar, el darrer informe d'estat. No oblideu que la comunicació no hauria d’aturar-se simplement perquè es restableixi el servei. Els interessats importants obtenen un resum del que va passar, del que es va aprendre i de com es pot prevenir la situació en el futur.

L’automatització en aquest cas es pot implementar per crear una pàgina d’estat automàtica en temps real per a les parts interessades, a més de crear ordres de barra a la vostra eina de xat per actualitzar aquesta pàgina.

5. Recolliu dades per donar suport a la gestió de problemes

La restauració del servei no representa el final de la gestió d’incidents. De fet, algunes de les activitats més valuoses es produeixen després de la resolució. Recopilant dades de diagnòstic i d’impacte i realitzant anàlisis de causes primàries, podeu realitzar una auditoria completa d’un incident important que inclogui posar mesures preventives en lloc per evitar incidents similars en el futur. A més, encara que es torni a produir un incident recognoscible, podeu crear un procediment definit per a quins tipus de dades heu de recopilar i els passos que cal produir per a la resolució d’unitats. D’aquesta manera, el vostre equip simplement s’ha de referir a una llista de control i centrar-se en el seu objectiu principal de restaurar el servei, en lloc de preocupar-se per què necessiten i quan.

L’automatització aquí pot capturar i preservar activitats de resolució, incloses coses com les transcripcions de xat, en un sistema únic de registre per a l’anàlisi. A més, us ajudarà a crear un catàleg d’incidents o problemes familiars, a solidificar les millors pràctiques per a cadascuna i, per tant, a augmentar la velocitat de resolució en el futur.

En conclusió: automatitzar més intel·ligent, no més

Tingueu en compte que més automatització no és necessàriament el millor enfocament! És més important que entengueu quan, on i com connectar els vostres sistemes de TI per donar suport a la gestió d’incidents. No voldreu afegir cap complexitat innecessària pel fet d’augmentar processos automatitzats. Recordeu que l’objectiu és simplificar i consolidar les operacions al màxim possible per tal de fer que els vostres equips se sentin empoderats per afrontar els problemes de manera eficient. Es tracta d’implementar de manera intel·ligent l’automatització per facilitar un conjunt ben coordinat de processos, personal experimentat i comunicacions efectives amb les parts interessades, per tal de minimitzar l’impacte global dels negocis dels grans incidents.