VCAP – Sección 6 – Troubleshooting de Memoria y CPU

Que tal Gente, vamos a continuar con los temas de estudio para la certificación VCAP-DCA, en este caso nos toca hablar sobre troubleshooting de Memoria y CPU en vSphere.

Identificar métricas relacionadas con memoria y CPU dentro de esxtop / resxtop

Memoria:

SWR/s – en caso de tener este medidor distinto a “0″  nuestro host esta leyendo de swap (.vswp).

SWW/s – en caso de tener este medidor distinto a “0″ nuestro host esta escribiendo a swap (.vswp).

MCTLSZ – en el caso que el valor de este medidor sea distinto a “0″ nuestro host esta reclamando memoria de las VMs utilizando el balloon driver.

ZIP/s – en el caso que el valor de este medidor sea distinto a “0″ nuestro host esta comprimiendo memoria.

CPU:

%RDY – porcentaje del tiempo de ejecución de un world (proceso de vm) en el cual se encuentra listo para ser enviado a un procesador físico para su ejecución pero este ultimo no esta disponible, por lo cual esta en una fila o “queue” de procesador, si el valor de %RDY es mayor  a “10″ tenemos problemas, generalmente debido a la cantidad de vCPUs que hemos entregado en el host.

%MLMTD – porcentaje del tiempo de ejecución de una vm en el cual no ha sido procesada debido a los limites de cpu configurados para la misma. En el caso que este sea distinto a “0″ debemos modificar el limite de dicha vm si es que tenemos problemas con ella.

%SWPWT – este indicador solo lo veremos activo cuando nuestro host este realizando swap de memoria , por este indicador nos muestra la cantidad de tiempo que la vm esta esperando al vmkernel para leer paginas del swap.

%CSTP – porcentaje del tiempo de ejecución de un world en cual el vmkernel lo pone en modo “co-deschedule”, para ser mas claros , en el caso que una vm tenga smp (symmetric multiprocessing) y el OS o la aplicación ejecutada dentro de dicho os no es capaz de llevar un manejo inteligente de los distintos cpus generando así mas carga en un vCPU que otro, generando así un des balance. Este valor nos ayuda para determinar que una aplicación u OS en especifico no manejan de manera correcta multiples cpus, también nos puede indicar afinidad de un vcpu.

%SYS – porcentaje de tiempo en el cual servicios o worlds del sistema se ha dedicado a dicha vm, generalmente en el caso de tener un valor mayor a “20″ nos indica que dicha vm tiene una alta cantidad de i/o.

 

Identificar métricas de performance relacionadas con memoria y CPU dentro del vCenter

Dentro de nuestro vCenter tenemos la pestaña de “performance” donde se nos presentan dos vistas, Overview y Advanced. Dentro de “advanced” tenemos la capacidad de ver la información de metricas de una manera mas puntual, inluso tenemos opción de modificar que datos se nos presentan en estas graficas haciendo click en “chart options”:

 

¿Que datos debemos siempre tener bajo control?

Memoria:

  • Balloon, recordemos que se requiere de las vmtools instaladas para poder reclamar memoria de una vm, por lo cual siempre debemos de tenerlas instaladas.
  • TPS (transparent page sharing) (shared), recordemos que TPS solo actúa con paginas de 4k, por lo cual si estamos utilzando Large Pages veremos muy poca memoria compartida, solo hasta que exista un nivel alto de overcommitment estaremos viendo un mayor número de paginas compartidas.
  • Uso de Swap (swap used, swap in rate y swap out rate), en casos de overcommitment alto.
  • Consumida
  • Compressed, esto nuevamente en casos de overcommitment alto. (4.1)

CPU:

  • Usage , con esta métrica podemos saber como están los consumos en cuanto a CPU se refiere de nuestras VMs o host que seleccionemos.
  • Swap wait , tiempo que se espera para lectura de swap.
  • Ready, tiempo en el cual la vm estaba lista para ejecutar operaciones en CPU pero por cuestiones de contención der recursos no se puede procesar.

 

Les recomiendo leer mi post VCAP-Sección 3 – optimizando recursos de VMs para entender mejor todos estos términos.

 

Utilizar Hot-Add para resolver problemas identificados tanto de CPU como Memoria

En el caso que tengamos identificado un problema en cuanto a CPU y/o memoria se refiere podemos incrementar la cantidad de recursos que una VM tiene asignados en “caliente” es decir, agregarle vCPUs (Hot Plug) con la VM ejecutándose y/o memoria RAM (Hot Add), si han seguido mis posts sabrán que se tienen limitaciones y requerimientos para poderlo habilitar, en el post VCAP-Sección 3 – optimizando recursos de VMs podrán encontrar cuales son y como habilitar Hot add/Hot Plug.

 

 

 

Leave a Reply