martes, 15 de abril de 2014

Como aplicar Blackout mediante Event Selector + Event Policy + TimeFrame en ProactiveNet

Hace unos días un cliente envió la duda de ¿cómo aplico un Blackout en BMC ProactiveNet ?

Iniciamos primero definiendo ¿que es un Blackout?, El Blackout mejor identificado como una ventana de mantenimiento en la cual se requiere que la Gestión de Monitoreo sea interrumpida, esto con la finalidad de modificar el ambiente en Gestión de Monitoreo sin tener alertas del mismo.

explico un escenario sin una solicitud de Blackout, Un administrador de sistema operativo UNIX realiza una actividad sin notificar a la administración de Gestión de Monitoreo, para mala suerte del administrador de sistemas UNIX su servidor esta con BMC Patrol Agent por lo que toda actividad en ese equipo se notifica, por ejemplo si el administrador de OS pasa un archivo grande a un FS el cual toca el umbral definido como Major (Warning) se envía un evento a BPPM el cual se notifica mediante una política de Gestión de Notificación, si el FS en cuestión toca el umbral de Critical se genera un segundo evento el cual notifica mediante correo electrónico y automáticamente genera un incidente mediante el IBRSD nativo entre el ARS y BPPM (esto si así está configurado el ambiente en las mejores prácticas de Gestión de Notificación y Gestión de Incidentes)  automáticamente todos los involucrados en mantener el servicio de ese servidor alterado sin previa notificación nuestro BPPM envía notificaciones a todos los responsables y genera un incidente por la actividad ya que es peligrosa por el nivel de criticidad, así mismo impacta en el servicio de negocio soportado en ese servidor por actividades no planeadas.

Ahora la mejor practica bajo los estándares de la librería de gestión de servicios de tecnología de la información dice “Todo cambio que impacte o degrade 1% de la disponibilidad total en la gestión de servicios de negocio tiene que ser validado y discutido en el CAB o si se requiere en el ECAB” siguiendo las mejores prácticas de ITIL  pensemos que la ventana de mantenimiento ya fue discutida en el CAB el cual todos las areas (OS, DB, Monitoreo, Servicios, Red y seguridad) dieron el visto bueno. Ahora nosotros responsables de la Gestión de Monitoreo realizamos las configuraciones adecuadas que aplican al requerimiento.

Requerimiento;
Programar un blackout global de todos los eventos Major y Critical de la infraestructura.
Programar un blackout de eventos de transacciones web.

Mejor practica;
La superioridad de los productos de BMC Software en comparación de el resto es superior tratándose de configuraciones adecuadas según las mejores prácticas de ITIL y del propio corporativo (clientes finales)
¿Por qué? En productos de BMC Software hay una guía de buenas prácticas las cuales es responsabilidad de los administradores de Gestión de Monitoreo validar y analizar esa guía de buenas prácticas de las soluciones para aplicarlas y usarlas según su gestión de servicios de negocios y crear sus propias buenas prácticas apoyándose de ITIL y la educación y experiencia en los productos de BMC Software Performance Manager. Con esa experiencia y conocimiento es que se puede crear una buena práctica en la gestión de servicios de negocio interna del cliente final.

En este Post expongo la que a mi experiencia pienso es la más adecuada y estándar en los distintos corporativos, cliente finales y ambientes.

Hay que tener en cuenta que en BMC ProactiveNet hay que tener niveles de configuración ordenados, concretos y eficientes para tener una correcta administración del ambiente.
A que me refiero con ello, por ejemplo no podemos reprochar al aplicativo que no alerta un evento crítico si NO hay un umbral definido como crítico, una política de notificación por correo electrónico que se alinee con el umbral definido como crítico, así mismo no se puede reprochar al producto no generar incidente en ARS si no hay las dos antes mencionadas y la configuración correcta del IBRSD y lo más importante la política de evento y la política de propagación en el BEM.
BMC ProactiveNet es una solución Proactiva como su nombré lo dice pero en más de 80% de los escenarios los administradores tiene errores de capa 8 cuando se correlacionar configuraciones para la gestión de notificaciones y gestión de eventos automáticos propagando por IBRSD en asía el ARS. 


No hay comentarios.: