Análise de Logs VMware para Solução de Problemas

Os produtos de software do servidor VMware fornecem arquivos de log que registram dados sobre eventos de cada componente de software com carimbos de data e hora. Os logs da VMware podem ser usados para solução de problemas e para diagnosticar e resolver problemas. Esta postagem no blog aborda os logs do ESXi e do vCenter, explica como verificar os logs no VMware vSphere, como encontrar as informações necessárias e analisá-las.

Logs do ESXi

O VMware ESXi é um hypervisor amplamente utilizado que permite aos usuários criar e gerenciar máquinas virtuais em servidores físicos. Para garantir o funcionamento adequado, solução de problemas e monitoramento dos servidores ESXi, vários logs são gerados. Esses logs capturam eventos importantes, erros e dados de desempenho, ajudando administradores e equipes de suporte a identificar problemas e manter a estabilidade da infraestrutura virtual. Abaixo está uma explicação de alguns logs essenciais do VMware ESXi.

Logs do VMkernel

/var/log/vmkernel.log 

Este log registra atividades do VMkernel, incluindo eventos de driver de dispositivo, armazenamento, rede e outras atividades relacionadas ao kernel. Ele fornece insights sobre operações de sistema de baixo nível e é crucial para diagnosticar problemas relacionados ao hardware. A localização do log vmkernel é o diretório /var/log/.

/var/log/vmkwarning.log

Este arquivo de log contém mensagens de aviso geradas pelo VMkernel, que é o núcleo do hypervisor ESXi. Ele registra eventos e condições que podem exigir atenção, mas não são erros críticos.

/var/log/vmksummary.log

O vmksummary.log é um log de resumo que fornece uma visão geral do estado operacional do host ESXi, incluindo eventos de inicialização e desligamento, uso de recursos do sistema e algumas estatísticas de desempenho chave.

Logs de gerenciamento do host

/var/log/hostd.log

Este log contém entradas relacionadas ao serviço de gerenciamento de host ESXi (hostd). Ele captura eventos relacionados a operações de energia de máquinas virtuais, processamento de tarefas e eventos, e comunicação com o vCenter Server, se aplicável.

Logs de máquinas virtuais

/vmfs/volumes/datastore_name/vm_name/vmware.log

Cada máquina virtual mantém um arquivo de log capturando eventos específicos daquela VM, como operações de energia, alterações de hardware virtual e eventos de aplicativos dentro do sistema operacional convidado. O local do arquivo vmware.log é um diretório de VM em um datastore.

Logs de armazenamento

/var/log/vobd.log

Este log enfoca questões relacionadas a operações de armazenamento e iSCSI.

/var/log/vmkernel.log

Como mencionado anteriormente, os logs VMkernel também capturam eventos relacionados ao armazenamento.

Logs de rede

/var/log/vobd.log

Este log inclui eventos relacionados à rede, como vMotion, conectividade de rede e erros de comunicação.

/var/log/vmkernel.log

Os logs VMkernel também contêm mensagens relacionadas à rede.

Logs de autenticação e usuário

/var/log/auth.log

Este registro registra eventos de autenticação, incluindo logins e logouts de usuários.

Logs do shell ESXi e SSH

/var/log/shell.log

Este log captura comandos do Shell ESXi (TSM) executados por usuários.

/var/log/ssh.log

Se o SSH estiver habilitado no host ESXi, este log registra eventos relacionados ao SSH.

Mensagens do sistema

/var/log/syslog.log

O syslog.log contém um registro abrangente de mensagens do sistema do VMkernel e vários serviços em execução no host ESXi. Ele captura uma ampla gama de informações, incluindo mensagens de inicialização, eventos de hardware, atividades de rede e muito mais.

Logs do firewall

/var/log/firewall.log

Este log rastreia eventos relacionados ao firewall do ESXi, incluindo conexões permitidas e negadas.

Logs do servidor vCenter no ESXi (se conectado a um servidor vCenter)

/var/log/vpxa.log

Este arquivo de log é específico para hosts ESXi gerenciados pelo servidor vCenter. O vpxa.log está relacionado ao Agente vCenter (vpxa) em execução no host ESXi. Ele registra interações entre o host ESXi e o servidor vCenter, incluindo tarefas iniciadas a partir do vCenter, como operações de energia de VMs, migrações e alterações de configuração, bem como atualizações de status do host, execução de tarefas e eventos, e comunicação com o servidor vCenter.

Logs de atualização do ESXi

/var/log/esxupdate.log

O esxupdate.log contém registros relacionados à atualização e patches do host ESXi. Este arquivo de log registra informações sobre a instalação, atualização e remoção de pacotes de software (VIBs) no host ESXi.

Logs USB

/var/log/usb.log

O arquivo usb.log registra eventos relacionados a dispositivos USB conectados ao host ESXi. Ele rastreia a detecção, conexão e desconexão de dispositivos USB, bem como quaisquer problemas relacionados ao USB pass-through ou uso de um serviço de arbitragem USB.

Logs do VMware vCenter

O VMware vCenter é uma plataforma de gerenciamento centralizada que permite aos administradores gerenciar eficientemente vários hosts VMware ESXi e máquinas virtuais. Para manter a saúde e o desempenho do servidor vCenter e dos hosts ESXi conectados a ele, vários logs são gerados, cada um servindo a um propósito específico. Abaixo está a explicação de alguns logs essenciais do VMware vCenter.

vpxd.log

Localização: /var/log/vmware/vpxd/vpxd.log

Este arquivo de log registra eventos relacionados ao serviço do vCenter Server e a localização do log vpxd é a /var/log/vmware/vpxd/ diretório em um servidor vCenter. O log vpxd contém informações sobre o início do serviço vCenter, eventos de conexão de clientes vSphere, autenticação de usuários, licenciamento, e várias tarefas administrativas realizadas através do cliente vSphere ou API.

/var/log/vmware/vpxd/vpxd-alert.log contém informações não críticas sobre o processo vpxd.

fdm.log

Localização: /var/log/fdm.log

O log do Fault Domain Manager (FDM) é crítico para vSphere High Availability (HA) solução de problemas. Ele contém informações sobre falhas de host e VM, configuração HA, dados de batimento cardíaco e eleição do host mestre em um cluster HA.

vmsyslogd.log

Localização: /var/log/vmware/vmsyslogd.log

Este arquivo de log está relacionado ao serviço syslog em execução na vCenter Server Appliance. Ele registra mensagens encaminhadas para o syslog do vCenter Server de vários componentes e serviços.

vmware-vpostgres.log

Localização: /var/log/vmware/vpostgres/postgresql-xx.log

Este log contém mensagens detalhadas relacionadas ao banco de dados PostgreSQL, incluindo status de replicação, logs de transações e outros eventos do banco de dados.

catalina.log

Localização: /var/log/vmware/vpostgres/catalina.out

Este arquivo de log pertence ao serviço de banco de dados VMware Postgres. Ele contém mensagens relacionadas a operações de banco de dados, incluindo eventos de inicialização e desligamento, consultas e erros.

sms.log

Localização: /var/log/vmware/sms/sms.log

O log do Storage Monitoring Service (SMS) registra eventos relacionados a tarefas de monitoramento e gerenciamento de armazenamento, incluindo datastores, dispositivos de armazenamento e alarmes de armazenamento.

invsvc.log

Localização: /var/log/vmware/invsvc/invsvc.log

O log do Inventory Service contém informações sobre operações de inventário do vCenter Server, como atualizações de objetos, coleta de dados e sincronização.

applmgmt.log

Localização: /var/log/vmware/applmgmt/applmgmt.log

Este arquivo de log está relacionado ao serviço de gerenciamento de aplicativos e fornece informações sobre o deploy e a configuração do vCenter Server Appliance.

vmware-sts-idmd.log

Localização: /var/log/vmware/sso/vmware-sts-idmd.log

Este log registra eventos relacionados ao serviço VMware Single Sign-On (SSO), gerenciamento de identidade e processos de autenticação.

stats.log

Localização: /var/log/vmware/perfcharts/stats.log

O arquivo stats.log está associado com o serviço de Gráficos de Performance do vCenter Server (também conhecido como Gráficos de Performance do vCenter). Ele contém dados estatísticos e informações relacionadas à performance coletadas pelo serviço de Gráficos de Performance.

O serviço de Gráficos de Performance fornece representações gráficas de métricas de performance para máquinas virtuais e hospedeiros. O stats.log registra dados que podem ser usados para gerar gráficos e diagramas de performance para monitoramento e análise do desempenho de componentes da infraestrutura virtual.

NOTA: O serviço de Gráficos de Performance é essencial para monitorar o desempenho em tempo real de VM e hospedeiros, e o stats.log desempenha um papel em armazenar os dados subjacentes.

eam.log

Localização: /var/log/vmware/eam/eam.log

O arquivo eam.log pertence ao serviço do ESX Agent Manager (EAM) no vCenter Server. O EAM é responsável por gerenciar os agentes vSphere, incluindo os VIBs (Virtual Infrastructure Bindings) e agentes de extensão.

O eam.log registra eventos e atividades relacionadas ao gerenciamento de todo o ciclo de vida dos agentes vSphere. Ele armazena informações sobre implantações de agentes, atualizações e validações. Se você estiver procurando a localização do log do VMware Lifecycle Manager, verifique /var/log/vmware/eam/eam.log

NOTA: O ESX Agent Manager garante que as versões corretas de VIBs estejam instaladas em hosts ESXi e que os agentes de extensão estão registrados corretamente. O eam.log é fundamental para rastrear essas operações e detetar quaisquer problemas relacionados aos agentes vSphere.

Onde os registros são armazenados

Vamos descobrir em qual partição e em quais diretórios os logs da VMware são armazenados. Em uma instalação padrão do VMware ESXi, os logs são armazenados em vários diretórios em diferentes partições. A localização típica dos logs da VMware, como os logs do VMkernel em um host ESXi, é:

/scratch/log/

Os symlinks estão localizados em /var/log/, mas os arquivos de log são armazenados em uma partição scratch do ESXi (veja as capturas de tela acima e abaixo). Nós cobrimos a partição scratch e o armazenamento temporário quando explicamos como instalar o ESXi em uma unidade flash USB.

Por exemplo, você pode acessar os Registros de Gerenciamento de Host em /var/log/hostd.log usando o symlink (link simbólico), mas o arquivo hostd.log está localizado no diretório log na partição /scratch.

Os Logs de Máquina Virtual geralmente estão localizados em um datastore de VM no diretório da VM e não são excluídos após o reboot do servidor ESXi, por exemplo: /vmfs/volumes/nome_do_datastore/nome_da_vm/vmware.log

Quando um arquivo de log da VM (vmware.log) está cheio, ele é renomeado para vmware-1.log, vmware-2.log, etc.

Você pode habilitar ou desabilitar os logs da VM indo para Configurações da VM > Opções da VM no Cliente VMware vSphere e expandindo as Opções Avançadas, que incluem a caixa de seleção Habilitar logging.

Assim, a partição /scratch é usada para armazenar logs e outros arquivos temporários em um host ESXi. Em algumas instalações, a partição /scratch é configurada como um sistema de arquivos em memória (tmpfs). Se você precisar preservar logs através de reinicializações, você pode configurar um local de armazenamento persistente para logs usando o comando “esxcli system syslog” e outros comandos explicados abaixo.

Tenha em mente que as localizações dos logs do ESXi podem variar dependendo da versão e configuração do ESXi. Além disso, os logs podem ser armazenados em um dispositivo de armazenamento persistente se configurado explicitamente pelo administrador do sistema.

Localização dos logs do vCenter

A maioria dos logs do vCenter Server está localizada no diretório /var/log/vmware/. O VMware vCenter Server não armazena logs em uma partição temporária (não persistente) como o ESXi. Em vez disso, os logs do vCenter Server geralmente são armazenados no disco local do sistema operacional ou em um volume de armazenamento montado, o que significa que eles são persistentes através de reinicializações. O Appliance do VMware vCenter Server (VCSA) é baseado no Photon Linux, como nos lembramos e o VCSA é a abordagem de implantação mais recente usada nas últimas versões do vSphere.

A localização dos logs do vCenter para a instalação baseada em Linux (VCSA) é:

/var/log/vmware/vpx/

A localização exata dos logs do vCenter depende do sistema operacional no qual o servidor vCenter está instalado. O servidor vCenter baseado em Windows, que foi utilizado até o VMware vSphere 6.7 e está obsoleto, usava a seguinte localização padrão para armazenar os logs do VMware vCenter:

C:\ProgramData\VMware\vCenterServer\logs\

Observe que as localizações dos logs do vCenter podem variar dependendo da versão e configuração do servidor vCenter. Você sempre pode consultar a documentação oficial da VMware ou a documentação da versão específica do servidor vCenter para encontrar as localizações exatas dos logs.

Já que o servidor vCenter é uma plataforma de gerenciamento central, ele depende de logs persistentes para manter informações históricas e facilitar a solução de problemas e análise de desempenho ao longo do tempo. Ao contrário do ESXi, que usa um sistema de arquivos na memória para logs temporários (para algumas configurações padrão), os logs do servidor vCenter são projetados para serem persistentes e são armazenados em um dispositivo de armazenamento permanente. Quanto ao armazenamento não persistente para logs do ESXi, você pode alterar a localização de armazenamento dos logs no ESXi.

Como Acessar os Logs da VMware

Nós exploramos o que são os logs da VMware e onde eles são armazenados. Agora precisamos descobrir como verificar os logs do VMware ESXi para realizar análises adicionais. Você pode acessar os logs do VMware ESXi de diferentes maneiras.

Cliente do Host VMware

Siga as seguintes etapas para visualizar os logs do ESXi no Cliente do Host VMware:

  1. Acesse o Cliente do Host VMware no seu navegador da web.
  2. Clique em Host>Monitor no painel Navegador e vá para a guia Logs.
  3. Selecione um dos logs do ESXi para visualizar as informações registradas. Você pode pesquisar a string necessária usando um campo de Busca.

DCUI (ESXi)

Você pode usar a interface de usuário do console direto no ESXi para visualizar logs. Você precisa de acesso físico a um host ESXi, incluindo um monitor e teclado, ou pode usar um switch KVM e tecnologias similares.

  1. Faça login na interface de usuário do console direto do ESXi (DCUI).
  2. Selecione a entrada Visualizar Logs do Sistema no menu Customização do Sistema.
  3. Pressione uma tecla de 1 a 6 para visualizar o log do VMware apropriado em seu servidor ESXi. A explicação para cada dígito é exibida no painel direito da interface.

  4. Depois de inserir o dígito necessário, você verá uma página em tela cheia com os logs. Você pode digitar / e inserir uma string de busca para exibir apenas linhas com as informações necessárias. Pressione q para sair deste modo e voltar ao menu DCUI anterior.

Navegador da web

Use um link num navegador da Internet para abrir uma página com links para download de arquivos de log. Você deve entrar com suas credenciais com permissões de administrador para o host ESXi para acessar esta página.

https://<ESXI_host_IP>/host

Linha de comando ESXi

A Linha de comando ESXi, semelhante ao DCUI, pode ser usada para visualizar logs do ESXi se a conexão de rede estiver indisponível e você não puder usar métodos para visualizar logs remotamente via rede.

  1. Certifique-se que a Shell ESXi estiver habilitada no DCUI (Opções de resolução de problemas > Habilitar Shell ESXi).
  2. Pressione Alt+F1 para abrir a shell do ESXi.
  3. Use comandos para visualizar logs do ESXi.

SSH

Acesso remoto via SSH é uma das formas mais práticas e poderosas para visualizar e analisar logs do VMware.

  1. Habilite o SSH no DCUI (Opções de resolução de problemas > Habilitar SSH) ou no Cliente VMware Host para permitir o acesso remoto via SSH a um host ESXi.
  2. Conecte-se ao host ESXi usando um cliente SSH (por exemplo, PuTTY se conectando de Windows).
  3. Use comandos para visualizar logs do ESXi e para análise de log do VMware.

Análise de Log do VMware com Exemplos

Agora sabemos os nomes e localizações dos logs da VMware, bem como os métodos para acessar os logs que são inestimáveis para solucionar vários problemas em um ambiente virtualizado. É hora de explorar alguns exemplos práticos de como usar os logs da VMware para solução de problemas.

Identificação de problemas de conectividade do host ESXi

Problema: As máquinas virtuais em um host ESXi estão enfrentando problemas intermitentes de conectividade de rede.

Logs para verificar:

  • /var/log/vmkernel.log
  • /var/log/vobd.log
  • /var/log/hostd.log

Passos de solução de problemas. Verifique os logs do VMkernel em busca de mensagens relacionadas à rede e procure por erros ou pacotes perdidos. Além disso, revise os logs do hostd em busca de problemas de serviço de gerenciamento do host. O vobd.log pode fornecer insights sobre problemas relacionados ao armazenamento que podem estar afetando a rede VM.

Falha na criação de snapshot de VM

Problema: A tentativa de criar um snapshot de uma máquina virtual falha.

Logs para verificar:

  • /vmfs/volumes/datastore_name/vm_name/vmware.log
  • /var/log/vmkernel.log

Passos de solução de problemas. Examine o vmware.log da máquina virtual específica em busca de erros ou mensagens de aviso relacionadas ao snapshot. Ao mesmo tempo, verifique os logs do VMkernel em busca de problemas relacionados ao armazenamento que possam impedir a operação de snapshot.

Degradação de desempenho de VM

Problema: Uma máquina virtual está enfrentando problemas de desempenho, como alto uso de CPU ou memória.

Logs para verificar:

  • /vmfs/volumes/datastore_name/vm_name/vmware.log
  • /var/log/vmkernel.log

Passos de solução de problemas. Analise o vmware.log da VM afetada em busca de erros específicos de aplicativos ou picos de utilização de recursos. Simultaneamente, verifique os logs do VMkernel em busca de mensagens relacionadas ao desempenho e certifique-se de que o host ESXi tenha recursos suficientes disponíveis.

Falha na inicialização do serviço vCenter

Problema: O serviço do vCenter Server falha ao iniciar.

Logs para verificar:

  • /var/log/vmware/vpxd/vpxd.log no servidor vCenter
  • /var/log/vpxa.log em um host ESXi

Passos de solução de problemas. Revise o vpxd.log em busca de erros ou exceções durante a inicialização do vCenter Server. Além disso, verifique o vpxa.log nos hosts ESXi gerenciados para garantir a comunicação adequada entre o vCenter e os hosts.

Problema de falha de failover de cluster de Alta Disponibilidade (HA) da VMware

Problema: As máquinas virtuais falham ao reiniciar em outros hosts em um cluster HA após uma falha de host ESXi.

Logs para verificar: /var/log/fdm.log

Passos de resolução de problemas. Analise o fdm.log nos hosts afetados para identificar quaisquer erros ou problemas com o cluster de HA. Procure por mensagens de batimento cardíaco, o processo de eleição do host mestre e possíveis razões para falhas na migração de VM.

Falha na vMotion

Problema: A vMotion da VMware falha ao tentar migrar uma VM entre hosts.

Registos a verificar:

  • /var/log/vmkernel.log
  • /var/log/vobd.log

Passos de resolução de problemas. Inspeccione o vmkernel.log para mensagens relacionadas com a vMotion e quaisquer problemas de conectividade de rede. Além disso, verifique o vobd.log para possíveis problemas relacionados com o armazenamento que possam afetar a vMotion.

Problemas na instalação das VMware Tools

Problema: A instalação das VMware Tools falha numa máquina virtual.

Registos a verificar: /vmfs/volumes/datastore_name/vm_name/vmware.log

Passos de resolução de problemas. Revise o vmware.log dentro da VM por erros relacionados com as VMware Tools ou mensagens de instalação.

Ao solucionar problemas com registros do VMware, é essencial correlacionar eventos em vários registros para obter uma compreensão abrangente do problema. Além disso, ferramentas de análise de registros, como o VMware Aria Operations for Logs (anteriormente vRealize Log Insight), podem ajudar a otimizar o processo de revisão de registros e permitir uma solução de problemas do VMware mais eficiente em ambientes complexos.

Solucionando Problemas de Armazenamento

Você pode usar registros do VMware para identificar problemas com unidades de disco rígido ou unidades de estado sólido, por exemplo, se houver blocos defeituosos em um HDD. Para identificar problemas com unidades de disco rígido (HDDs) ou unidades de estado sólido (SSDs) em um ambiente VMware, você pode usar vários registros do VMware para rastrear e analisar eventos e erros relacionados ao armazenamento.

  1. Reveja os registros do VMkernel (/var/log/vmkernel.log):

    Os registros do VMkernel fornecem informações do sistema em nível baixo, incluindo eventos relacionados ao armazenamento. Procure por mensagens indicando erros de E/S de disco ou códigos de sentido SCSI relacionados a problemas de disco.

    Exemplo de erro: “Erros de E/S do dispositivo“, “Erro de mídia detectado” ou “Erro não corrigível nos dados

  2. Verifique os logs específicos de armazenamento (/var/log/vobd.log):

    O vobd.log contém mensagens relacionadas ao armazenamento, incluindo erros encontrados pelo subsistema de armazenamento.

    Exemplo de erro: “Erro de armazenamento: Dispositivo ‘naa.xxxxxxxxxxxxxx’… Sentido: Erro de leitura não recuperado”

  3. Examine os logs específicos da máquina virtual (/vmfs/volumes/datastore_name/vm_name/vmware.log):

    Os logs específicos da máquina virtual podem revelar erros de E/S de disco encontrados por uma VM específica.

    Exemplo de erro: “Erro de E/S de disco ocorreu em um ou mais discos virtuais”, “Erro de disco detectado” ou “Pilha de erros: Não é possível ler a tabela de partição”

Recomendações: O que usar além dos logs do VMware

Há recomendações do que usar com os logs do VMware para diagnósticos e solução de problemas melhores e mais detalhados para detectar problemas de armazenamento a tempo.

  • Monitorar Alarmes e Eventos do vCenter. Fique de olho nos alarmes e eventos do servidor vCenter relacionados ao armazenamento. Alarmes acionados por problemas de armazenamento podem fornecer insights sobre possíveis problemas de disco.
  • Utilizar Verificações de Saúde da VMware. A VMware fornece várias verificações de saúde que podem ser realizadas através do Cliente vSphere. Essas verificações podem identificar problemas relacionados ao armazenamento e oferecer recomendações.
  • Utilizar Ferramentas de Monitoramento de Terceiros. Implemente ferramentas especiais de monitoramento de TI e análise de logs para centralizar e analisar dados de logs de vários hosts e VMs. Essas ferramentas podem ajudar a identificar problemas relacionados a discos em toda a infraestrutura virtual.
  • Ao identificar blocos defeituosos em HDDs, é essencial prestar atenção em várias mensagens de erro e padrões, especialmente aqueles que indicam erros de mídia ou leitura/escrita. Blocos defeituosos podem levar à corrupção de dados ou degradação de desempenho e a detecção precoce pode evitar problemas mais graves. Se os dados em dispositivos de disco falhados forem perdidos, a recuperação de dados a partir de um backup VMware para discos saudáveis é essencial.

Problemas de ClusterO uso de logs do VMware ESXi e logs do vCenter pode ser fundamental para identificar problemas relacionados a clusters em seu ambiente virtualizado. Problemas de cluster podem se manifestar como problemas de desempenho de VM, falhas de HA, falhas de vMotion ou outras operações relacionadas a clusters.

O uso dos logs do VMware ESXi e do vCenter pode ser fundamental na identificação de problemas relacionados a clusters em seu ambiente virtualizado. Problemas de cluster podem se manifestar como problemas com desempenho da VM, failover de HA, falhas de vMotion ou outras operações relacionadas a clusters.

  • Revise os logs do servidor vCenter:
    • Acesse os logs do vCenter, como vpxd.log e vpxa.log, localizados em /var/log/vmware/vpxd/vpxd.log e /var/log/vpxa.log respectivamente.
    • Procure por mensagens de erro ou aviso relacionadas a operações de cluster, gerenciamento de recursos e comunicação entre o vCenter e os hosts ESXi.
    • Preste atenção a eventos durante a criação de cluster, alterações de configuração e problemas com serviços de cluster.
  • Verifique os logs do host ESXi e acesse os logs do host ESXi, incluindo vmkernel.log, hostd.log e fdm.log:
    • vmkernel.log: Analise para verificar quaisquer eventos relacionados ao cluster, como tentativas de vMotion, problemas de batimento cardíaco do HA ou erros durante o compartilhamento de recursos.
    • hostd.log: Procure mensagens relacionadas ao cluster relacionadas a tarefas e eventos tratados pelo serviço de gerenciamento do host.
    • fdm.log: Analise para verificar eventos relacionados ao HA, incluindo falhas de host, reinicializações de VM e eventos de eleição de mestre.
  • Inspect virtual machine logs:
    • Acesse os logs da VM, como vmware.log, para identificar problemas específicos de VMs individuais no cluster.
    • Os logs da VM podem fornecer informações sobre o desempenho da VM, restrições de recursos ou falhas durante operações de vMotion.
  • Monitorar alarmes e eventos específicos do cluster:
    • Use o vCenter para criar alarmes e eventos específicos do desempenho e da saúde do cluster.
    • Configure alarmes para problemas como uso excessivo de recursos, partição de cluster ou falhas de VM.
    • Verifique a aba Eventos do vCenter para eventos relacionados ao cluster, como migrações de VM, reconfigurações de cluster ou eventos de HA.

Combinando informações dos logs do ESXi, logs do vCenter, métricas de desempenho e eventos específicos do cluster, você pode obter um entendimento abrangente da saúde do cluster e identificar problemas que afetam o desempenho das máquinas virtuais, a alta disponibilidade e a estabilidade geral do cluster. A análise regular de logs e a monitoração proativa podem ajudar a prevenir problemas de cluster ou resolvê-los rapidamente quando ocorrem.

Solução de problemas de rede

Solução de problemas de rede no VMware vSphere envolve identificar e resolver problemas relacionados à rede que afetam máquinas virtuais e comunicação entre hosts ESXi. Os logs do VMware ESXi e do vCenter podem ser instrumentais na localização desses problemas. A seguir estão alguns exemplos de solução de problemas de rede usando logs do ESXi e do vCenter, juntamente com comandos para extrair informações relevantes.

Identificando problemas de conectividade de rede VM

Problema: Uma máquina virtual não consegue acessar a rede.

  • A command to check VMkernel logs (on an ESXi host):

    cat /var/log/vmkernel.log | grep -E 'Failed to send packet|dropped|no network'

    Este comando filtra os logs do VMkernel para mensagens relacionadas a falhas de pacotes, pacotes descartados ou indisponibilidade de rede.

  • A command to check VM network configurations (on an ESXi host):

    esxcfg-vmknic -l

    Este comando lista as interfaces de rede VMkernel configuradas e endereços IP no host ESXi. Verifique se a rede da VM está corretamente configurada.

Solucionando problemas de vMotion

Problema: vMotion falha entre dois hosts ESXi.

  • A command to check VMkernel logs (on both source and destination ESXi hosts):

    cat /var/log/vmkernel.log | grep -E 'Migration to host|vMotion'

    Este comando ajuda a encontrar mensagens relacionadas a vMotion em ambos os hosts ESXi de origem e destino.

  • A command to check vCenter events (on vCenter Server):

    vim-cmd vmsvc/get.eventlog <vmid> | grep 'Migrate'

    Substitua <vmid> pelo ID da máquina virtual (VMID) da VM afetada. Este comando recupera o log de eventos da VM e pesquisa eventos relacionados a vMotion.

Identificando gargalos de desempenho de rede

Problema: As máquinas virtuais experimentam degradação no desempenho de rede.

  • A command to check ESXTOP statistics (on an ESXi host):

    esxtop

    Dentro do esxtop, pressione n para alternar para a visualização de rede. Monitore métricas como Taxa de Dados de Rede (MBTx/rx), Pacotes de Rede/s e Pacotes Perdidos/s para identificar potenciais gargalos. Essa e a próxima comandos são usados para exibir dados não de um arquivo de log do VMware, mas sim informações atualizadas em tempo real para solução de problemas do VMware. Você também pode ver o tempo de atividade do ESXi usando o comando esxtop.

Solucionando problemas do vSphere Distributed Switch (VDS)

Problema: Problemas de conectividade com VMs em um vSphere Distributed Switch.

  • A command to check VDS health (on vCenter Server):

    net-dvs -l

    Este comando lista todos os switches virtuais distribuídos (VDS) e seus status.

  • A command to check VDS port status (on vCenter Server):

    net-dvs -p <Nome do VDS>

    Substitua <Nome do VDS> pelo nome do VDS. Este comando exibe o status de todas as portas no switch virtual distribuído especificado.

Lembre-se, a solução de problemas de rede geralmente requer a análise de logs e dados de desempenho de múltiplas fontes, incluindo logs do VMkernel, logs do vCenter, métricas de desempenho e configurações de rede. Os exemplos fornecidos acima servem como pontos de partida para coletar informações relevantes para problemas de rede e você pode precisar ajustar os comandos com base no problema específico que encontrar em seu ambiente vSphere.

Expressões Regulares para Análise de Logs do VMware

Como você pode ver nos exemplos acima, acessar o shell ESXi via SSH e usar a linha de comando é um método poderoso para visualizar logs do VMware e para análise de logs do VMware. Você pode usar ferramentas de linha de comando nativas como ferramentas de análise de logs do VMware ESXi. Essas ferramentas de linha de comando são familiares aos usuários do Linux:

  • cat é uma ferramenta de linha de comando que concatena e exibe o conteúdo de um ou mais arquivos de texto no terminal. É comumente usado para visualizar todo o conteúdo de um arquivo de uma só vez. No entanto, para arquivos grandes, usar cat pode resultar em uma quantidade esmagadora de saída rolando rapidamente para fora da tela, tornando-o menos prático para a leitura desses arquivos.
  • less é uma utilidade de paginação de linha de comando que permite visualizar e rolar pelo conteúdo de um arquivo de texto. Ele exibe uma tela de texto por vez e fornece opções de navegação para avançar e retroceder no arquivo. Ao contrário de cat, que derrama todo o conteúdo do arquivo no terminal, less é útil para ler arquivos grandes de forma mais eficiente.
  • grep significa “Global Regular Expression Print”. É uma poderosa ferramenta de linha de comando usada para pesquisar padrões de texto (expressões regulares) em um ou mais arquivos. grep pode filtrar e exibir linhas contendo o padrão especificado. É comumente usado para pesquisas de texto, análise de logs e extração de informações específicas de arquivos.
  • tail é um utilitário de linha de comando que exibe as últimas linhas de um arquivo de texto. Por padrão, tail mostra as últimas dez linhas do arquivo. É particularmente útil para monitorar arquivos de log em tempo real, pois pode exibir novas entradas à medida que são adicionadas ao log. O comando tail é frequentemente usado com a opção -f para monitorar continuamente um arquivo e ver atualizações em tempo real.
  • head é um utilitário de linha de comando que exibe as primeiras N linhas de um arquivo de texto. Por padrão, a ferramenta head mostra as primeiras 10 linhas do arquivo. Ajuda a visualizar rapidamente o início de um arquivo ou extrair informações iniciais. Semelhante a tail, você pode especificar o número de linhas a serem exibidas usando a opção -n.

Você pode usar essas ferramentas de linha de comando em conjunto umas com as outras e com expressões regulares para a maior eficiência da análise de logs do VMware. Analisar arquivos de log usando expressões regulares (regex) na linha de comando do ESXi pode ser uma maneira poderosa de extrair informações específicas e obter insights sobre problemas ou padrões. Abaixo, você pode ver alguns exemplos práticos reais de como usar expressões regulares para análise de logs no ESXi.

Filtragem de logs para eventos específicos

Suponha que você queira encontrar todas as ocorrências de um evento específico, como “Erro de E/S de disco“, no arquivo vmkernel.log.

cat /var/log/vmkernel.log | grep -E 'Erro de E/S de disco'

Este comando exibirá todas as linhas contendo a frase “Erro de E/S de disco” no vmkernel.log.

Extração de endereços IP de logs

Para extrair endereços IP de logs no arquivo hostd.log, você pode usar um padrão de regex que corresponda a endereços IPv4.

cat /var/log/hostd.log | grep -E -o '([0-9]{1,3}\.){3}[0-9]{1,3}'

Este comando exibirá todos os endereços IPv4 encontrados no hostd.log.

Encontrando padrões com quantificadores

Suponha que você queira encontrar todas as linhas no arquivo vmware.log que contenham qualquer número de dígitos consecutivos.

cat /vmfs/volumes/datastore_name/vm_name/vmware.log | grep -E '[0-9]+'

Este comando exibirá todas as linhas contendo um ou mais dígitos no vmware.log.

Pesquisa de múltiplos padrões

Para encontrar linhas no arquivo vpxd.log contendo “error” ou “warning”, você pode usar o operador OR | no padrão regex.

cat /var/log/vmware/vpxd/vpxd.log | grep -E 'error|warning'

Este comando exibirá todas as linhas contendo “error” ou “warning” no vpxd.log.

Correspondência com curingas

Suponha que você deseje encontrar todas as linhas no arquivo vobd.log que contenham a palavra “failed” independentemente do caso.

cat /var/log/vobd.log | grep -i 'failed'

Este comando exibirá todas as linhas contendo “failed“, “FAILED“, “Failed“, etc., no vobd.log.

Usando grupos de captura

Para extrair informações de data e hora de linhas no arquivo sms.log, você pode usar grupos de captura no padrão regex.

cat /var/log/vmware/sms/sms.log | grep -Eo '([0-9]{4}-[0-9]{2}-[0-9]{2}) ([0-9]{2}:[0-9]{2}:[0-9]{2})'

Este comando exibirá todas as ocorrências de data e hora no sms.log.

OBSERVAÇÃO: Você pode alterar o caminho para o log necessário para seu caso de uso específico.

Esses exemplos demonstram como usar expressões regulares em combinação com o comando grep para realizar análise de logs no interface de linha de comando do ESXi. Expressões regulares fornecem capacidades poderosas de correspondência de padrões, permitindo que você extraia informações específicas, filtre logs e encontre padrões de forma eficiente. Tenha em mente que os padrões regex reais podem variar dependendo do conteúdo do arquivo de log e das informações que você deseja extrair ou pesquisar. Você pode usar esses exemplos e ajustar os comandos para atender às suas necessidades específicas para análise de logs do VMware.

Como Exportar Logs do VMware e Baixar Pacote de Suporte

Pode acontecer que a análise de logs do VMware não ajude a resolver problemas que ocorreram em um host ESXi ou vCenter. Nesse caso, você pode exportar logs ou baixar um pacote de suporte e enviar essas informações para o suporte do VMware. Especialistas do suporte do VMware podem ajudá-lo a resolver problemas no ambiente do VMware se você tiver uma versão licenciada do VMware vSphere.

VMware Host Client

Para gerar um pacote de suporte e exportar logs do VMware, siga estas etapas:

  1. Clique em Monitorar na guia Navegador.
  2. Selecione a guia Logs.
  3. Clique em Gerar pacote de suporte.
  4. Salve o arquivo de pacote baixado em seu navegador da web.

VMware vSphere Client

Para exportar logs do sistema VMware no vSphere Client, faça o seguinte:

  1. Selecione a visualização de Hosts e Agrupamentos e selecione o host ESXi cujos logs você deseja exportar (na parte esquerda, que é a guia de navegação).
  2. Clique com o botão direito no host ESXi e clique em Exportar logs do sistema na lista de opções que abre.

  3. Selecione quais logs do ESXi deseja exportar e clique em Exportar logs.

Para enviar o pacote para o suporte do VMware no cliente vSphere, siga os passos abaixo:

  1. Clique no ícone Menu no canto superior esquerdo.
  2. Vá para Administração > Suporte > Enviar Arquivo para Solicitação de Serviço e clique no botão Enviar Arquivo para Solicitação de Serviço.

Link em um navegador da web

Use o link para o script cgi no host ESXi:

http://<Endereço_IP_do_ESXi>/cgi-bin/vm-support.cgi

Faça o download e salve o pacote com os logs do ESXi exportados (um arquivo .tgz).

Gerar um pacote no shell do ESXi (linha de comando)

Você pode executar o comando para gerar um pacote de suporte contendo logs do ESXi no shell do ESXi com o comando:

/usr/bin/vm-support

Conclusão

Ao resolver problemas com o VMware vSphere, incluindo ESXi e vCenter, a análise dos logs do VMware pode ajudar os administradores a identificar a causa raiz dos problemas e tomar as medidas corretivas apropriadas. Ao analisar esses logs, os administradores podem identificar e resolver problemas como gargalos de desempenho, problemas de conectividade, erros de configuração e possíveis preocupações de segurança. A revisão regular dos logs é essencial para a gestão proativa e para manter a estabilidade e confiabilidade do VMware vCenter e do ambiente virtualizado.

A monitorização regular da infraestrutura VMware e o backup de VM permitem prevenir problemas a tempo e evitar a perda de dados.

Source:
https://www.nakivo.com/blog/vmware-logs-analysis-for-troubleshooting/