viernes, 9 de octubre de 2015

Implementación de Infraestructura TI, Monitoreo de servidores de misión critica (post 1 de n)

Primeros pasos.
¿Por qué importante contar con monitoreo de servidores en un data center?
El monitoreo en infraestructuras de data center es fundamental y comparte uno de los papeles mas importantes dentro de la organización ya que por lo regular los servidores en data center no pueden ser reiniciados o apagados de forma no controlada.


Escenario.
Supongamos que usted es un cliente que contrata servicios de misión crítica, sus servidores alojan servicios los cuales tienen que estar 24 horas los 365 días del año con disponibilidad total. De no contratar un servicio de monitoreo inteligente como se daría cuenta usted o sus administradores que sus servicios tienden a degradaciones o en el peor de los casos que su sistema esta fuera de línea.
Es por ello es que es importante contar con un sistema de monitoreo de servidores, esto para garantizar una alta disponibilidad en los servicios de TI de las compañías que manejan servicios de misión critica.

Soluciones para el monitoreo de servidores de misión critica
Existen distintos software de monitoreo para servidores de misión critica en data center los cuales nombraremos según su nivel de detalle, especialidades y alcances.

IBM Tivoli:
Solución de monitoreo para servidores IBM, su pros son comunicación nativa con contadores de servidores IBM así como monitoreo de softwares de fabricante nativos.  Contras no tiene una gran gama de contadores para monitoreo de aplicativos especiales como por ejemplo; Microsoft Exchange 2012, Oracle 11G, Weblogic y Jbossde red hat.

Nimsoft IT Monitor:
Solución de monitoreo de la compañía CA Technologies, pros esta enfocado para monitoreo de servidores virtuales basadas en tecnologías ESXi de VMware. Contras no tienen soporte para servidores físicos así como aplicativos especiales como base de datos, aplicativos web, comunicaciones unificadas.

Compuware Server Vantage:

La compañía Compuware tiene una amplia gama de módulos para monitoreo de distintas aplicaciones, servidores y ambientes, sus Pros son su código de programación, ya que de no contar con un monitoreo nativo con las aplicaciones o servidores que se requiere se puede programar un contador mediante scripts. Contras no tiene soporte nativa para Oracle RAC, Websphere y transacciones dinámicas de proyectos web´s.

BMC Performance Management:
BMC Software, Pros es la solución de monitoreo de infraestructuras y servidores de misión crítica con un amplio soporte para aplicativos especiales, cuenta con soporte para todas las bases de datos contiene un numero considerable de parámetros para monitoreo, tienen documentación que da soporte a a administradores de aplicativos ajenos al monitoreo dotando de información para tener en mente los distintos parámetros y módulos de conocimientos que se pueden monitorear. Contras su soporte es muy lento ya que tienen niveles de contratación de soporte de no contar con el nivel de soporte mas caro el resto de los niveles son de largas esperas y de soluciones no eficiente.

Definición de  ambiente de monitoreo Software y servicios


El ambiente de monitoreo estará conformado por 4 aplicativos que contienen varios servicios a continuación se describirá cada uno de ellos.

BMC Patrol Agent:
Patrol Agent es un aplicativo que se instala en los servidores a monitorear, sus funciones son reportar a una consola central el comportamiento de los parámetros de monitoreo a monitorear, entiéndase por parámetro como por ejemplo CPU, memoria, uso de discos duros, espacios de disco duros, usos de red, disponibilidad del agente de monitoreo o disponibilidad del servidor, a los parámetro también se les conoce como Módulos de conocimiento o en ingles Knowledge Module

BMC Patrol Central:
Este aplicativo es la consola que colecta información, los agentes de monitoreo se conectan a esta consola para reportar el comportamiento de los parámetros en monitoreo.

BMC TMART
TMART o Transaction Management Application Response Time es la consola de monitoreo de transacciones web, este aplicativo monitorea la disponibilidad de los portales web´s, su desempeño, exactitud y salud. TMART esta integrada a BPPM con esto se generan correos electrónicos a una lista de destinatarios pre definidos e incidentes en Remedy



ARS 7.6
ARS 7.6 o Action Request System mejor conocido como Remedy es el gestor y administración de incidentes por excelencia en los grandes comparativos. En remedy se documentan los incidentes reportados por BPPM (Proactive Net Performance Management)

BMC Proactive Net Performance Management (BPPM)
BPPM Proactive Net Performance Management es la consola de monitoreo que implementaremos con este manual, BPPM tiene muchas bondades entre las mas  sobresalientes es que es una solución que aprende el comportamiento de los parámetros en monitoreo, es decir por ejemplo, BPPM monitoreo durante un mes el uso de CPU el cual no sube de 88% de uso, sin embargo de repente sube arriba del 90% y sobre pase la línea base programada, inmediatamente envía una notificación por correo electrónico a el personal requerido.



Ilustración 1 arquitectura de plataforma de monitoreo






Descripción
La arquitectura presentada se conforma de lo siguiente
En primer lugar están los servidores que se monitorean con agentes Patrol Agent estos pueden ser servidores de aplicativos, servidores de base de datos, servidores de aplicativos, etc.
Los agentes de monitoreo Patrol Agent se conectar a la consola central de monitoreo Patrol Central que en esta infraestructura funge como un colector de datos los cuales se envían a la consola de incidentes BPPM Proactive Net Performance Management. BPPM gestiona en base a umbrales, listas de correos y parámetros en monitoreo si los incidentes son considerados como mayores o críticos. Los incidentes mayores son notificados vía correos electrónicos a una lista de distribución pre definida y los incidentes críticos son notificados tanto por correo electrónico como por incidentes en el sistema de gestión de incidentes ARS 7.6 Action Request System mejor conocido como Remedy de esta forma la mesa de servicio con servicio de 24/7 esta al tanto de estos incidentes con este sistema.
Ahora hablando de el monitoreo de los proyectos web´s encontramos la solución Transaction Management Application Response Time o TMART la cual trabaja sin agentes de monitoreo, en la consola de tmart se agrega la URL a monitorear, por ejemplo supongamos que una URL no responde tmart detecta que la disponibilidad de la pagina web esta comprometida y envía el dato a BPPM quien informa mediante correo electrónico y mediante incidente a la mesa de servicio. Con estos servicios los administradores así como los operadores de la mesa de servicio pueden actuar con pro actividad ante los incidentes tanto de servidores, base de datos,  proyectos web´s o aplicativos.



¿Que se puede monitorear con BMC Patrol Agent?

Con BMC Parol Agent podemos tener en monitoreo sistemas operativos Enterprise como
-       Servidores Windows
-       Servidores Linux Red Hat
-       Servidores aix
-       Servidores hp-ux
-       Servidores Solaris sparc

¿Qué tipo de aplicativos puedo monitorear con BMC Patrol Agent?
Con BMC Patrol Agent podemos monitorear aplicativos como
-       SQL Server
-       DB2
-       Oracle 10G, 11G
-       Oracle RAC
-       Active Directory
-       Exchange
-       Informix
-       Websphere


Instrucciones para la instalación de BMC Patrol Central




Requerimientos para la instalación de BMC Patrol Central

-       Windows server se recomienda Enterprise 2008 R2 64Bits
-       8GB de memoria RAM
-       200 GB de espacio en disco divididos en dos discos duros  (100 y 100)
-       4 procesadores de 2.8GHZ
Instalacion de Windows