¡Te damos la bienvenida al nuevo sysarmy --help! Para recuperar tu usuario pedí un password reset.

Estadisticas, Monitoreo y Tendencias SNMP VMware

Gente.

Tengo 16 ESXi hosts integrados con 2 vCenters (8 para uno, 8 al otro)
La pregunta es:

Que utilizan para traerse estadisticas de los hosts? (SNMP? o shellscript?)

y mas importante:
Que estadisticas miran? VMs encendidas? Uso de Memoria del host?
A nivel Guest OSs miran algo?

Mas que nada porque voy a tener que estar haciendo capacity planning y estoy medio ciego por ahora salvo las herramientas de monitoreo embebidas de VMware.

Tengo un Cacti que uso para monitorear todo, pero desconozco si es integrable al nivel de granularidad de boludeces que me muestra el vCenter.

Gracias!

Respuestas

  • Hola! Cualquiera sea la herramienta que uses (Cacti, Nagios, Zabbix, hay mucho en el mercado... ) como bien decís lo importante es que monitorear y donde prestar mas atención.

    A nivel de ESX los chequeos de Hardware son MUY importantes: temperatura, sensores del chasis, energia, ventiladores, discos rigídos, interfaces de red, etc. Si el hardware de uno o varios esx fallan, fallan las vm's y colapsa todo el cluster como bola de nieve.

    En segundo orden que el uso de memoria y procesadores no supere los umbrales establecidos para cumplir las reglas de HA del cluster en caso de contingencia o bien para un mantenimiento programado. Esto sobre hay que controlarlo de cerca cuando tenes DRS en modo manual o semi automático.

    A nivel de Guest, es importante controlar: VMtools actualizadas y en ejecución, verificar que los discos no hayan quedado en Read Only y que la hora esté bien sincronizada. También es importante controlar los snapshots de las máquinas, si los hacés. Tratar de consolidarlos dentro de lo posible para no malgastar espacio en disco y que el snapshot no quede obsoleto.

    El control del storage es también un factor clave. Controlar consumo de IOPS, ancho de banda y Procesadores. Y sobre todo, muy importante y que suele suceder pero todos los administradores descuidan, el espacio en disco de los vcenters y os recursos en general. Estos servers colectan muchisima info por segundo y suelen tener una demanda de storage inesperada por momentos y cuando se quedan sin lugar donde escribir, todo se detiene y no vuelve a levantar solo cuando se normaliza. Podes aprovechar que tenés dos y ponerlos en linked mode para mayor redundancia.

    En general podes regular la mayoría de los problemas que podrían surgir desde la misma plataforma vSphere, haciendo restricciones y limitando el uso mediante la agrupación de vm's por pools, aplicando control de iops, balloning, etc. Se puede tener mucha previsión y no debería ser complicado hacer una buena planeación (Inclusive hay herramientas especificas de VMware).
  • Hola!

    Yo estoy monitoreando varios ESXi standalone y vía Vcenter con Check_MK a través del plugin nativo. Solo tenes que crear un user de lectura con permisos sobre la rama CIM y ya funciona vía https.

    Con eso podes ver, CPU, memoria, hardware sensors, multipathing, placas de red y utilización de los datastores. No es exactamente una herramienta de capacity planning pero sirve para el monitoreo continuo y alertas más importantes.

    Si necesitás un monitoreo más fino tenes que ir a soluciones exclusivas tipo Veeam One
  • Buenas, Paso a comentarte: para proyectos de capacity planning, monitoreo y reportes. VMware tiene una herramienta que se llama vRealize Operationes manager que cumple exactamente las funciones que estas pidiendo.
  • Por el ambiente que describís, tenés todo legal, dependiendo de nivel de licencia que tengas de vmware, podés acceder al vCOPS que está muy bueno.

    Una vez que lo ponés en marcha y configurás, lo dejás andando un mes y ahi vas a empezar a tener un nivel de estadísticas de utilización y proyecciones mas que interesante.

    Una de las cosas que a mi mas me gusta, es la parte de "wasted resources".

    sds



    tequesta
  • Yo estoy teniendo un problema parecido, para monitorear probe algunas cosas pero termine usando pysphere, una libreria de python para interactuar con la api de vcenter. Anda muy bien aunque me gustaria que me de algunos datos mas. Lo que hago es un userparam de zabbix que ejecuta un programa en python (hecho por mi) que toma los datos. Yo lo uso solo para tomar datos pero con pysphere podes apagar, prender, hacer snapshots, etc...

    Saludos
Este hilo ha sido cerrado.