Monitoramento de Recursos

V1.1 – Dezembro 2023

Versão Autor Descrição
V1.0 – 2023-12-20 Diogo Hatz 50037923 Versão Inicial
V1.0 – 2023-12-21 Wisley da Silva 00830850 Revisão do Documento

Introdução

O Cloud Eye (CES) é uma ferramenta gratuita para o monitoramento de recursos da Huawei Cloud. Além do monitoramento de recursos, o Cloud Eye também pode ser utilizado para criar alarmes baseados em eventos ou métricas, identificar o mau funcionamento de recursos e rapidamente reagir à mudança de recursos. Vale ressaltar que, por mais que o Cloud Eye seja um serviço gratuito, as cobranças geradas pelo envio de notificações ao disparar alarmes são cobradas.

Este documento tem como objetivo descrever as principais funcionalidades do serviço Cloud Eye e guiar o leitor a utilizar o CES para o monitoramento de recursos da nuvem, como ECSs, VPNs e CBRs etc. Ademais, também é descrito como criar alarmes baseados em eventos ou métricas e customizar dashboards para o monitoramento de recursos.

Cloud Eye no console

Overview

Ao abrir o Cloud Eye no console, a página inicial que será carregada é a Overview, na qual é possível ter uma visão geral de todos os recursos utilizados na Huawei Cloud, a utilização geral de rede, CPU, memória e disco e quais recursos dispararam alarmes recentemente e precisam de uma maior atenção.

  • Visão geral dos recursos: Permite a visualização do número total de recursos monitorados e os alarmes gerados para esses recursos.

  • Estatística dos alarmes: Mostra os alarmes disparados nos últimos sete dias por severidade do alarme.

  • Monitoramento de servidores: Permite a visualização da utilização geral de CPU e memória dos servidores monitorados e uma lista do top 5 ECSs ranqueados pela utilização de CPU ou memória.

  • Monitoramento de rede: Mostra a utilização geral de largura de banda de EIPs e uma lista do top 5 EIPs ranqueados por utilização de largura de banda.

  • Monitoramento de armazenamento: Permite a visualização da utilização geral de disco (EVS) por IOPS de leitura e escrita e uma lista do top 5 discos ranqueados por IOPS.

É possível ter uma visão de como a página inicial do Cloud Eye é nas imagens abaixo:

Monitoramento de servidores

O monitoramento de servidores (ECSs e BMSs) pode ser visualizado na seção Server Monitoring. Vale ressaltar que para o monitoramento de servidores, a instalação do agente (Telescope) é recomendada, uma vez que providencia métricas mais específicas e precisas, de acordo com o anexo 4.1.

A instalação do agente pode ser feita de três formas distintas: de forma manual, automática ou em lote. Independentemente da forma de instalação escolhida, é necessário configurar as permissões para o agente previamente: na seção de monitoramento de servidores, clique em Configure no aviso de que a permissão do agente não foi configurada para a região atual.

Automática:

Para instalar o agente de forma automática, basta clicar na peça de quebra-cabeça na seção de monitoramento de servidores e na coluna de status do agente na ECS/BMS correspondente e aguardar a instalação do agente.

Manual:

Para instalar o agente de forma manual, primeiramente vá para a seção relativa à ECS ou BMS, a depender do tipo de servidor em que o agente será instalado.

Selecione Remote Login para realizar o login no servidor desejado

Realize o login no servidor digitando o usuário e a senha configurados no momento de criação do servidor e, posteriormente, digite o seguinte comando, caso a região em que o servidor se encontre seja LA-Santiago:

cd /usr/local && curl -k -O https://uniagent-la-south-2.obs.la-south-2.myhuaweicloud.com/script/agent_install.sh && bash agent_install.sh

Caso a região em que o servidor se encontre seja diferente de LA-Santiago, é possível encontrar a lista de comandos por região no seguinte link: https://support.huaweicloud.com/intl/en-us/usermanual-ces/ces_01_0029.html

Caso a mensagem em vermelho acima apareça ao final da instalação, o agente foi instalado com sucesso.

Dashboard

A seção Dashboard diz respeito à área em que gráficos personalizados podem ser criados para o monitoramento de serviços e recursos selecionados, com as métricas escolhidas.

Para criar um dashboard, navegue até a seção My Dashboards em Dashboards e clique em Create Dashboard.

Escolha um nome para o dashboard em Name e clique em OK.

Para adicionar gráficos para o monitoramento de métricas específicas, gráficos podem ser adicionados à dashboards. Para adicionar um gráfico, clique no dashboard criado e em Add Graph.

Escolha o tipo de gráfico a ser criado e clique em OK.

Certas configurações podem ser feitas ao adicionar um gráfico a uma dashboard, como se o mesmo gráfico irá possuir múltiplas métricas ou somente uma métrica, o período em que os dados foram coletados, o tipo de dado que será visualizado (dados brutos, máximo, mínimo, média ou soma) e as métricas a serem mostradas.

Em Metric Display selecione One graph for a single metric para adicionar uma única métrica ao gráfico ou selecione One graph for multiple metrics para adicionar múltiplas métricas ao gráfico.

Clique em Select Resource and Metric para selecionar o recurso que será monitorado e a métrica para esse recurso.

Selecione o tipo de serviço que será monitorado à esquerda da página Select Resource and Metric, o recurso específico a ser monitorado na área central da página e as métricas desse recurso à direita. Neste exemplo, o uso da CPU, disco, memória e rede serão monitorados na “ecs-9152”.

Ajuste o horário da coleta dos dados no canto superior direito da página Add Graph.

Uma amostra do gráfico gerado irá aparecer na página. Clique em Save para confirmar e adicionar o gráfico à dashboard.

Na dashboard, é possível criar uma legenda para o gráfico, edita-lo, colocá-lo em tela cheia, recarregar os dados mostrados no gráfico e mover o gráfico de lugar.

No Cloud Eye é possível criar inúmeras dashboards com diversos gráficos em cada dashboard, sendo que cada gráfico pode mostrar múltiplas métricas de monitoramento. Além disso, como descrito no tópico 3.1, na seção Overview do CES é possível ter a visualização geral dos recursos monitorados com as principais métricas utilizadas, como uso de CPU, memória e disco em servidores; uso de rede e um total de alarmes disparados no Cloud Eye.

Monitoramento de serviços da nuvem

Na seção Cloud Service Monitoring, dashboards para cada recurso dos serviços de ECS, EIP e largura de banda, NAT e VPN são criados automaticamente durante a criação desses recursos. As principais métricas de monitoramento desses serviços são adicionadas em forma de gráfico nessa seção para o monitoramento rápido e geral desses serviços.

Além da visualização dos gráficos relativos às principais métricas monitoradas, também é possível exportar os dados coletados clicando no botão Export Data.

Anexos

Métricas de monitoramento de servidores

Métricas Sem agente Agente instalado
Uso de CPU Sim Sim / Dedicado
Uso de disco Sim Sim
Uso de memória Sim Sim / Dedicado
Largura de banda de escrita em disco Sim Sim
Largura de banda de leitura em disco Sim Sim
IOPS de escrita em disco Sim Sim
IOPS de leitura em disco Sim Sim
Taxa de entrada em banda Sim Sim
Taxa de saída em banda Sim Sim
Taxa de entrada fora de banda Sim Sim
Taxa de saída fora de banda Sim Sim
Uso de crédito de CPU Sim Sim
Balanceamento de crédito de CPU Sim Sim
Excedente de balanceamento de crédito de CPU Sim Sim
Excedente de crédito carregado de CPU Sim Sim
Conexões de rede Sim Sim
Largura de banda de entrada por servidor Sim Sim
Largura de banda de saída por servidor Sim Sim
PPS de entrada Sim Sim
PPS de saída Sim Sim
Novas conexões Sim Sim
Erros incorrigíveis agregados de ECC Sim Sim
Páginas aposentadas com erros de bit único Sim Sim
Páginas aposentadas com erros de bit duplos Sim Sim
Status de saúde da GPU Sim Sim
Uso de encoder da GPU Sim Sim
Uso de decoder da GPU Sim Sim
Erros corrigíveis voláteis de ECC Sim Sim
Erros incorrigíveis voláteis de ECC Sim Sim
CPU ociosa Não Sim / Dedicado
Uso de CPU de espaço de usuário Não Sim / Dedicado
Uso de CPU de espaço de kernel Não Sim / Dedicado
Uso de CPU de outros processos Não Sim / Dedicado
Uso de CPU de processos ótimos Não Sim / Dedicado
Tempo em que a CPU está esperando por operações de E/S Não Sim / Dedicado
Tempo de interrupção de CPU Não Sim / Dedicado
Tempo de interrupção de CPU por software Não Sim / Dedicado
Memória disponível Não Sim / Dedicado
Memória ociosa Não Sim / Dedicado
Buffer Não Sim / Dedicado
Cache Não Sim / Dedicado
Largura de banda de entrada por NIC Não Sim / Dedicado
Largura de banda de saída por NIC Não Sim / Dedicado
Taxa de pacotes enviados por NIC Não Sim / Dedicado
Taxa de pacotes recebidos por NIC Não Sim / Dedicado
Taxa de pacotes com erro recebidos por NIC Não Sim / Dedicado
Taxa de pacotes com erro transmitidos por NIC Não Sim / Dedicado
Taxa de pacotes recebidos largados por NIC Não Sim / Dedicado
Taxa de pacotes transmitidos largados por NIC Não Sim / Dedicado
Processos em execução Não Sim / Dedicado
Processos ociosos Não Sim / Dedicado
Processos zombies Não Sim / Dedicado
Processos bloqueados Não Sim / Dedicado
Processos dormindo Não Sim / Dedicado
Total de processos Não Sim / Dedicado
Taxa de retransmissão TCP Não Sim / Dedicado
TCP SYS_SENT Não Sim / Dedicado
TCP SYS_RECV Não Sim / Dedicado
TCP FIN_WAIT1 Não Sim / Dedicado
TCP FIN_WAIT2 Não Sim / Dedicado
TCP CLOSE Não Sim / Dedicado
TCP LAST_ACK Não Sim / Dedicado
TCP LISTEN Não Sim / Dedicado
TCP CLOSING Não Sim / Dedicado
Média de carga da CPU no último minuto Não Sim / Dedicado
Média de carga da CPU nos últimos 15 minutos Não Sim / Dedicado
Média de carga da CPU nos últimos 5 minutos Não Sim / Dedicado
TCP ESTABLISHED Não Sim / Dedicado
TCP TOTAL Não Sim / Dedicado
UDP TOTAL Não Sim / Dedicado
NTP Offset Não Sim / Dedicado
Total de arquivos processados Não Sim / Dedicado

Métricas de monitoramento de VPN Gateway

Métricas Suportado
Taxa de pacotes de entrada Sim
Taxa de pacotes de saída Sim
Largura de banda de entrada Sim
Largura de banda de saída Sim
Uso de largura de banda de entrada Sim
Número de conexões Sim
Uso de largura de banda de saída Sim

Métricas de monitoramento da conexão VPN

Métricas Suportado
Média de RTT do túnel Sim
Máximo de RTT do túnel Sim
Taxa de perda de pacotes do túnel Sim
Média de link RTT Sim
Máximo de link RTT Sim
Taxa de perda de pacotes do link Sim
Status da conexão VPN Sim
Taxa de recebimento de pacotes Sim
Taxa de envio de pacotes Sim
Taxa de recebimento de tráfego Sim
Taxa de envio de tráfego Sim
Taxa de envio de pacote SA Sim
Taxa de recebimento de pacote SA Sim
Taxa de envio de tráfego SA Sim
Taxa de recebimento de tráfego SA Sim

Métricas de monitoramento de NAT

Métricas Suportado
Conexões SNAT Sim
Largura de banda de entrada Sim
Largura de banda de saída Sim
PPS de entrada Sim
PPS de saída Sim
Tráfego de entrada Sim
Tráfego de saída Sim
Taxa de uso de conexões SNAT Sim
Taxa de uso de largura de banda de entrada Sim
Taxa de uso de largura de banda de saída Sim
Total de largura de banda de saída (UDP) Sim
Total de largura de banda de saída (TCP) Sim
Total de largura de banda de entrada (UDP) Sim
Total de largura de banda de entrada (TCP) Sim
Pacotes perdidos por conexões SNAT excessivas Sim
Pacotes perdidos por excesso de PPS Sim
Pacotes perdidos por todos os portes EIP alocados Sim

Referências