A partir da versão 13.2, o VOS oferece a capacidade de configurar uma interface IP tolerante a falhas, configurando adaptadores Ethernet ativos/em espera. O adaptador ativo recebe um endereço MAC Ethernet e o adaptador em espera recebe outro. Se o adaptador ativo falhar, o adaptador em espera é reiniciado para usar o endereço MAC ativo e se torna o adaptador ativo. Quando o adaptador ativo anterior volta a funcionar, ele assume a função do adaptador em espera, incluindo seu endereço MAC. Os hosts remotos que se comunicam com o módulo por meio da interface IP observam, na pior das hipóteses, um atraso de cerca de um segundo durante a transição.
O problema é que não basta configurar o VOS, os switches de rede aos quais os adaptadores ativo e em espera estão conectados também devem ser configurados corretamente. Isso geralmente não é um problema quando a parceria ativo/em espera é configurada pela primeira vez, mas com o tempo é possível que a configuração do switch sofra alterações que não prejudicam as comunicações atuais, mas impedem uma failover perfeita quando o VOS altera o estado do adaptador em espera para ativo.
Existem três maneiras de descobrir que essas mutações na configuração do switch ocorreram.
A primeira é quando o adaptador ativo falha e o VOS alterna o estado do adaptador em espera para ativo. Nesse momento, os hosts remotos não conseguem mais se comunicar com o módulo por meio dessa interface e você tem um adaptador com falha. Já presenciei essa situação muitas vezes – não é nada agradável.
A segunda maneira é revisar a configuração do switch. Isso envolve pedir ao administrador de rede para revisar uma configuração funcional em busca de algo que possa causar um problema – boa sorte.
A terceira é testar. Você pode usar o comando dlmux_admin para forçar uma failover ou, em alguns hardwares, você pode fisicamente retirar o adaptador do módulo ou usar um comando VOS para desativar o adaptador, mas eu prefiro apenas desconectar o adaptador ativo da rede. Se você já tiver uma conexão ativa com o módulo estabelecida, poderá saber em segundos se a failover foi perfeita ou não. Ao fazer isso no momento de sua escolha, você pode escolher um horário em que haverá menos interrupções se a failover não for perfeita. Além disso, como o adaptador ainda está funcionando, a recuperação é simples: conecte o cabo novamente e desconecte o adaptador recém-ativado, aguarde outra failover e, em seguida, conecte o adaptador agora em standby novamente.
Se o teste mostrar que a failover não é perfeita, você terá o luxo de trabalhar com o administrador de rede em um problema comprovado, sem que ninguém exija saber quanto tempo levará para ser corrigido. Se o teste for perfeito, está tudo pronto. Como o título deste blog sugere, recomendo testar periodicamente, digamos, na primeira segunda-feira do mês.
