Saltar al contenido

Tableros de observabilidad (Beta) para agentes privados de Jitterbit 11.37 o posterior

Introducción

Las siguientes secciones muestran ejemplos de gráficos de tableros de observabilidad de agentes privados, lo que ilustra el gráfico y en qué métricas se basa el gráfico.

Las imágenes mostradas son del tablero de Datadog. Los tableros de Elasticsearch contienen los mismos gráficos y métricas.

Expande la siguiente sección para ver una vista de pantalla completa de un ejemplo de tablero de Datadog:

Ejemplo de tablero de Datadog

Tablero de Datadog

Capacidad del Agente (sección)

Los gráficos de esta sección muestran la capacidad del agente, su habilidad para procesar solicitudes. Los valores son:

  • Capaz: Valor 1 (mostrado en verde). Un agente capaz puede aceptar más operaciones para su procesamiento.

  • Incapaz: Valor 0 (mostrado en rojo). Un agente incapaz ha alcanzado su capacidad máxima de procesamiento y no puede aceptar más operaciones para su procesamiento.

Consejo

La disponibilidad y la capacidad son conceptos separados; un agente puede ser tanto disponible (registrado como en línea) como incapaz (ocupado procesando su carga de trabajo máxima).

Capacidad de la API a lo largo del tiempo

Capacidad de la API a lo largo del tiempo

Cómo ha cambiado la capacidad del agente para ejecutar APIs a lo largo del tiempo.

Métrica Descripción
com.jitterbit.agent.capability.api.capable El agente puede manejar APIs.

Agente Capaz

Agente capaz

Indicador de estado de un vistazo de la capacidad de cada agente a través de estas métricas:

Métrica Descripción
com.jitterbit.agent.capability.system.resource.capable El agente puede procesar operaciones.
com.jitterbit.agent.capability.runop.capable El agente puede ejecutar operaciones.
com.jitterbit.agent.capability.api.capable El agente puede manejar APIs.

Capacidad de CPU

Capacidad de CPU

El uso de CPU del agente y los valores de umbral de CPU a lo largo del tiempo.

Métrica Descripción
com.jitterbit.agent.capability.cpu.usage Uso de CPU del host del agente.
com.jitterbit.agent.capability.cpu.max.threshold Umbral de CPU.

Capacidad de Recursos del Sistema a lo largo del tiempo

Capacidad de recursos del sistema a lo largo del tiempo

La capacidad de recursos del host del agente a través del tiempo.

Métrica Descripción
com.jitterbit.agent.capability.system.resource.capable Capacidad de recursos del host del agente (1 = capaz, 0 = no capaz).

Capacidad de Memoria

Capacidad de memoria

El uso de memoria del host del agente y los valores de umbral de memoria a lo largo del tiempo.

Métrica Descripción
com.jitterbit.agent.capability.memory.usage Uso de memoria del host del agente.
com.jitterbit.agent.capability.memory.max.threshold Umbral de memoria.

Capacidad de Ejecución de Operaciones a lo largo del tiempo

Capacidad de ejecución de operaciones a lo largo del tiempo

La capacidad del agente para ejecutar operaciones a lo largo del tiempo.

Métrica Descripción
com.jitterbit.agent.capability.runop.capable Capacidad de ejecución de operaciones del agente (1 = capaz, 0 = no capaz).

Capacidad de Hilos de Apache

Capacidad de hilos de Apache

El número de hilos y el umbral de hilos para el servidor web Apache del agente.

Métrica Descripción
com.jitterbit.agent.capability.apache.usage Número de hilos de Apache utilizados.
com.jitterbit.agent.capability.apache.total Número de hilos de Apache permitidos.

Capacidad de Hilos de Cola

Capacidad de hilos de cola

El número de hilos de cola y el umbral de hilos de cola para el agente.

Métrica Descripción
com.jitterbit.agent.capability.queue.usage Número de hilos de cola utilizados.
com.jitterbit.agent.capability.queue.max Número de hilos de cola permitidos.

Operaciones del Agente (sección)

Operaciones a lo largo del tiempo

Operaciones a lo largo del tiempo

El número de operaciones exitosas, fallidas y en proceso a lo largo del tiempo.

Métrica Descripción
metric.operation.count.by.status Número de operaciones por estado etiquetado (exitoso, fallido, en_proceso).

Estados de las Operaciones a lo largo del tiempo

Estados de las operaciones a lo largo del tiempo

El número de operaciones en ejecución, exitosas (con información), enviadas y con error a lo largo del tiempo.

Métrica Descripción
metric.operation.count.by.status Número de operaciones por estado etiquetado (metric.operation.count.by.status, exito_con_info, enviada, error).

Las 10 Principales Operaciones

Top 10 operations

Métrica Descripción
metric.operation.count.by.status Número de operaciones por estado etiquetado.

Las 10 Principales Exitosas

Top 10 successful

Métrica Descripción
metric.operation.count.by.status Número de operaciones por estado etiquetado.

Las 10 Principales Fallidas

Top 10 failed

Métrica Descripción
metric.operation.count.by.status Número de operaciones por estado etiquetado.

Carga del Sistema (solo Linux)

System load

El promedio de carga del sistema en 5 minutos por grupo de agentes.

Métrica Descripción
system.load.5 Promedio de carga del sistema en 5 minutos.

Cola de Procesos del Sistema (solo Windows)

System process queue

El número promedio de hilos en la cola de procesos del sistema.

Métrica Descripción
system.proc.queue_length El número de hilos que se observan como retrasados en la cola de listos del procesador y que están esperando ser ejecutados.

Registros de Operaciones No Sincronizadas

Unsynced Operation Logs

El número de registros de operación de agente no sincronizados, graficados por tiempo.

Métrica Descripción
private_agent.unsynced_logs Número de registros de operación de agente no sincronizados.

Cola de mensajes entrantes por grupo de agentes

Cola de mensajes entrantes por grupo de agentes

El número de operaciones en la cola esperando ser procesadas por grupo de agentes.

Métrica Descripción
private_agent.incomingmsgtab_count Número de operaciones en la cola.

Trabajadores inactivos de Apache

Trabajadores inactivos de Apache

El número de hilos de trabajo inactivos de Apache por host de agente, graficados por tiempo.

Métrica Descripción
apache.performance.idle_workers Número de hilos de trabajo inactivos en el servidor web Apache del agente.

Trabajadores ocupados de Apache

Trabajadores ocupados de Apache

El número de hilos de trabajo ocupados de Apache por host de agente, graficados por tiempo.

Métrica Descripción
apache.performance.busy_workers Número de hilos de trabajo ocupados en el servidor web Apache del agente.

Conexiones de Postgres

Conexiones de Postgres

El número de conexiones activas a la base de datos PostgreSQL por host de agente, graficados por tiempo.

Métrica Descripción
postgresql.connections El número de conexiones activas a esta base de datos.

Filas de Postgres recuperadas / devueltas / insertadas / actualizadas (por seg)

Filas de Postgres recuperadas devueltas insertadas actualizadas

El número de filas recuperadas, devueltas, insertadas o actualizadas por segundo por la base de datos PostgreSQL del agente, graficado por tiempo.

Métrica Descripción
postgresql.rows_fetched El número de filas recuperadas por consultas en esta base de datos.
postgresql.rows_returned El número de filas devueltas por consultas en esta base de datos.
postgresql.rows_inserted El número de filas insertadas por consultas en esta base de datos.
postgresql.rows_updated El número de filas actualizadas por consultas en esta base de datos.

Postgres - Inserciones / actualizaciones / eliminaciones (por seg)

Inserciones actualizaciones eliminaciones de Postgres

El número de filas insertadas, actualizadas o eliminadas por segundo por la base de datos PostgreSQL del agente, graficado por tiempo.

Métrica Descripción
postgresql.rows_inserted El número de filas insertadas por consultas en esta base de datos.
postgresql.rows_updated El número de filas actualizadas por consultas en esta base de datos.
postgresql.rows_deleted El número de filas eliminadas por consultas en esta base de datos.

Postgres - Interbloqueos por base de datos

Interbloqueos de Postgres

El número de interbloqueos en la base de datos PostgreSQL por host del agente, graficado por tiempo.

Métrica Descripción
postgresql.deadlocks La tasa de interbloqueos detectados en esta base de datos.

Promedio de CPU del Agente

Promedio de CPU del agente

El porcentaje de tiempo que la CPU pasa en promedio en procesos de espacio de usuario y del núcleo, por host de agente, graficado por tiempo.

Métrica Descripción
system.cpu.user El porcentaje de tiempo que la CPU pasó ejecutando procesos de espacio de usuario.
system.cpu.system El porcentaje de tiempo que la CPU pasó ejecutando el núcleo.

Máximo de CPU del Agente

Máximo de CPU del agente

El porcentaje de tiempo que la CPU pasa en procesos de espacio de usuario y del núcleo, por host de agente, graficado por tiempo.

Métrica Descripción
system.cpu.user El porcentaje de tiempo que la CPU pasó ejecutando procesos de espacio de usuario.
system.cpu.system El porcentaje de tiempo que la CPU pasó ejecutando el núcleo.

Porcentaje de memoria utilizada

Porcentaje de memoria utilizada

El porcentaje de memoria utilizada respecto a la memoria total, por host de agente, graficado por tiempo.

Métrica Descripción
system.mem.total La cantidad total de RAM física.
system.mem.usable Valor de MemAvailable de /proc/meminfo si está presente, pero se recurre a sumar la memoria libre + en búfer + en caché si no.

IO de Red

IO de Red

El número de solicitudes de lectura y escritura, por host de agente, graficado por tiempo.

Métrica Descripción
system.io.r_s El número de solicitudes de lectura emitidas al dispositivo por segundo.
system.io.w_s El número de solicitudes de escritura emitidas al dispositivo por segundo.

Tráfico de red recibido (por seg)

Tráfico de red recibido

El número de kilobytes por segundo recibidos, por host de agente, graficado por tiempo.

Métrica Descripción
system.net.bytes_rcvd El número de bytes recibidos en un dispositivo por segundo.

Tráfico de red enviado (por seg)

Tráfico de red enviado

El número de kilobytes por segundo enviados, por host de agente, graficado por tiempo.

Métrica Descripción
system.net.bytes_sent El número de bytes enviados desde un dispositivo por segundo.

Porcentaje de espacio en disco utilizado

Espacio en disco utilizado

La cantidad de espacio en disco utilizado por dispositivo, graficado por tiempo.

Métrica Descripción
system.disk.used La cantidad de espacio en disco en uso.
system.disk.total La cantidad total de espacio en disco.

Utilización del disco (%) (solo Linux)

Utilización del disco

El porcentaje de utilización del espacio en disco, por host de agente, graficado por tiempo.

Métrica Descripción
system.io.util El porcentaje de tiempo de CPU durante el cual se emitieron solicitudes de I/O al dispositivo.
system.disk.utilized La cantidad de espacio en disco en uso como un porcentaje del total.

Tiempo de lectura del disco

Tiempo de lectura del disco

El porcentaje de tiempo dedicado a leer el disco, por host de agente, graficado por tiempo.

Métrica Descripción
system.disk.read_time_pct Porcentaje de tiempo dedicado a leer del disco.

Tiempo de escritura del disco

Tiempo de escritura del disco

El porcentaje de tiempo dedicado a escribir en el disco, por host de agente, graficado por tiempo.

Métrica Descripción
system.disk.write_time_pct Porcentaje de tiempo dedicado a escribir en el disco.

Memoria del Heap de Java

Memoria del heap de Java

La cantidad total de memoria del heap de Java, por host de agente, graficado por tiempo.

Métrica Descripción
jvm.heap_memory La memoria total del heap de Java utilizada.

Conteo de hilos de JVM

Conteo de hilos de JVM

Número de hilos de JVM, por host de agente, graficado por tiempo.

Métrica Descripción
jvm.thread_count El número de hilos activos.

Mensajes entrantes en la tabla por grupo

Mensajes entrantes en la tabla por grupo

Número de elementos en la tabla messagestab de PostgreSQL del agente, por host de agente, graficado por tiempo.

Métrica Descripción
private_agent.incomingmsgtab_count Número de filas en TranDb.messagestab.

Procesos de OperationsEngine

Procesos de OperationsEngine

Número de procesos del motor de operaciones, graficado por tiempo.

Métrica Descripción
proc.operationsengine.cpu.num_threads Número de hilos de CPU utilizados por el motor de operaciones.

Operaciones por agente (top 25)

Operaciones por agente top 25

Los 25 principales agentes por número de operaciones.

Métrica Descripción
proc.openginebyname.cpu.num_threads Número de hilos de CPU utilizados por el motor de operaciones por agente.

Conexiones activas del cliente de servicios del agente

Conexiones activas del cliente de servicios del agente

Número de conexiones activas de clientes por agente, graficado por tiempo.

Métrica Descripción
com.jitterbit.agent.services.client.active.connections Número de conexiones activas de clientes.

Conexiones máximas del cliente de servicios del agente

Conexiones máximas del cliente de servicios del agente

Número máximo de conexiones de clientes permitidas por agente, graficado por tiempo.

Métrica Descripción
com.jitterbit.agent.services.client.max.connections Número máximo de conexiones activas de clientes permitidas.

Conexiones disponibles del cliente de servicios del agente

Conexiones disponibles del cliente de servicios del agente

Número de conexiones de cliente disponibles por agente, graficadas por tiempo.

Métrica Descripción
com.jitterbit.agent.services.client.available.connections Número de conexiones de cliente disponibles.

Conexiones Activas del Cliente REST

Conexiones activas del cliente REST

Número de conexiones REST activas por cliente por agente, graficadas por tiempo.

Métrica Descripción
com.jitterbit.rest.client.active.connections Número de conexiones REST activas del cliente.

Máximas Conexiones del Cliente REST

Máximas conexiones del cliente REST

Número máximo de conexiones REST permitidas por cliente por agente, graficadas por tiempo.

Métrica Descripción
com.jitterbit.rest.client.max.connections Número máximo de conexiones REST permitidas del cliente.

Conexiones Inactivas del Cliente REST

Conexiones inactivas del cliente REST

Número de conexiones REST inactivas por cliente por agente, graficadas por tiempo.

Métrica Descripción
com.jitterbit.rest.client.available.connections Número de conexiones REST disponibles del cliente.

Conexiones Activas Locales del Cliente REST

Conexiones activas locales del cliente REST

Número de conexiones REST de cliente local activas por agente, graficadas por tiempo.

Métrica Descripción
com.jitterbit.rest.client.local.active.connections Número de conexiones REST de cliente local activas.

Conexiones Máximas de Cliente REST Local

Conexiones máximas de cliente REST local

Número máximo de conexiones REST de cliente local permitidas por agente, graficadas por tiempo.

Métrica Descripción
com.jitterbit.rest.client.local.max.connections Número máximo de conexiones REST de cliente local permitidas.

Conexiones Inactivas de Cliente REST Local

Conexiones inactivas de cliente REST local

Número de conexiones REST de cliente local disponibles por agente, graficadas por tiempo.

Métrica Descripción
com.jitterbit.rest.client.local.available.connections Número de conexiones REST de cliente local disponibles.

Operaciones Ejecutándose Fuera de Horario

Operaciones ejecutándose fuera de horario

Una lista de operaciones que se han ejecutado fuera de horario, y cuántas veces lo han hecho.

Métrica Descripción
metric.operation.runing.over.scheduled.interval Nombres de operaciones ejecutándose fuera de horario.

Operaciones Enviadas Esperando para Ejecutarse

Operaciones enviadas esperando para ejecutarse

Operaciones enviadas pero que aún no han comenzado. (La columna Operaciones Pendientes muestra cuántas instancias de operación están pendientes en estado Enviado.)

Métrica Descripción
metric.operation.count.by.status Número de operaciones por estado.

Duración de la Operación

Duración de la operación

Duración de finalización de la operación y el intervalo actual de ejecución de una instancia de operación, por ID de operación, graficado por tiempo.

Este gráfico muestra si una instancia de operación está tardando más que el tiempo promedio que toma la operación para finalizar.

Nota

Si hay cambios en la operación que aumentan el tiempo de ejecución, la duración promedio de la operación estará inicialmente sesgada, pero debería corregirse con el tiempo.

Métrica Descripción
private_agent.operation_run_time_seconds Cuánto tiempo ha estado ejecutándose la operación.
metric.operation.duration.seconds El tiempo promedio de ejecución de la operación.