Hace unos días un cliente envió la duda de ¿cómo aplico un Blackout en BMC ProactiveNet ?
Iniciamos
primero definiendo ¿que es un Blackout?, El Blackout mejor identificado
como una ventana de mantenimiento en la cual se requiere que la Gestión
de Monitoreo sea interrumpida, esto con la finalidad de modificar el
ambiente en Gestión de Monitoreo sin tener alertas del mismo.
explico
un escenario sin una solicitud de Blackout, Un administrador de sistema
operativo UNIX realiza una actividad sin notificar a la administración
de Gestión de Monitoreo, para mala suerte del administrador de sistemas
UNIX su servidor esta con BMC Patrol Agent por lo que toda actividad en
ese equipo se notifica, por ejemplo si el administrador de OS pasa un
archivo grande a un FS el cual toca el umbral definido como Major
(Warning) se envía un evento a BPPM el cual se notifica mediante una
política de Gestión de Notificación, si el FS en cuestión toca el umbral
de Critical se genera un segundo evento el cual notifica mediante
correo electrónico y automáticamente genera un incidente mediante el
IBRSD nativo entre el ARS y BPPM (esto si así está configurado el
ambiente en las mejores prácticas de Gestión de Notificación y Gestión
de Incidentes) automáticamente todos los involucrados en mantener el
servicio de ese servidor alterado sin previa notificación nuestro BPPM
envía notificaciones a todos los responsables y genera un incidente por
la actividad ya que es peligrosa por el nivel de criticidad, así mismo
impacta en el servicio de negocio soportado en ese servidor por
actividades no planeadas.
Ahora
la mejor practica bajo los estándares de la librería de gestión de
servicios de tecnología de la información dice “Todo cambio que impacte o
degrade 1% de la disponibilidad total en la gestión de servicios de
negocio tiene que ser validado y discutido en el CAB o si se requiere en
el ECAB” siguiendo las mejores prácticas de ITIL pensemos que la
ventana de mantenimiento ya fue discutida en el CAB el cual todos las
areas (OS, DB, Monitoreo, Servicios, Red y seguridad) dieron el visto
bueno. Ahora nosotros responsables de la Gestión de Monitoreo realizamos
las configuraciones adecuadas que aplican al requerimiento.
Requerimiento;
Programar un blackout global de todos los eventos Major y Critical de la infraestructura.
Programar un blackout de eventos de transacciones web.
Mejor practica;
La
superioridad de los productos de BMC Software en comparación de el
resto es superior tratándose de configuraciones adecuadas según las
mejores prácticas de ITIL y del propio corporativo (clientes finales)
¿Por
qué? En productos de BMC Software hay una guía de buenas prácticas las
cuales es responsabilidad de los administradores de Gestión de Monitoreo
validar y analizar esa guía de buenas prácticas de las soluciones para
aplicarlas y usarlas según su gestión de servicios de negocios y crear
sus propias buenas prácticas apoyándose de ITIL y la educación y
experiencia en los productos de BMC Software Performance Manager. Con
esa experiencia y conocimiento es que se puede crear una buena práctica
en la gestión de servicios de negocio interna del cliente final.
En
este Post expongo la que a mi experiencia pienso es la más adecuada y
estándar en los distintos corporativos, cliente finales y ambientes.
Hay
que tener en cuenta que en BMC ProactiveNet hay que tener niveles de
configuración ordenados, concretos y eficientes para tener una correcta
administración del ambiente.
A
que me refiero con ello, por ejemplo no podemos reprochar al aplicativo
que no alerta un evento crítico si NO hay un umbral definido como
crítico, una política de notificación por correo electrónico que se
alinee con el umbral definido como crítico, así mismo no se puede
reprochar al producto no generar incidente en ARS si no hay las dos
antes mencionadas y la configuración correcta del IBRSD y lo más
importante la política de evento y la política de propagación en el BEM.
BMC
ProactiveNet es una solución Proactiva como su nombré lo dice pero en
más de 80% de los escenarios los administradores tiene errores de capa 8
cuando se correlacionar configuraciones para la gestión de
notificaciones y gestión de eventos automáticos propagando por IBRSD en
asía el ARS.
No hay comentarios.:
Publicar un comentario