A partir de la versión 13.2 VOS ha ofrecido la posibilidad de configurar una interfaz IP tolerante a fallos mediante la configuración de adaptadores Ethernet activos/de reserva. Al adaptador activo se le da una dirección MAC de Ethernet y al de reserva otra. Si el adaptador activo falla, el modo de espera se restablece para utilizar la dirección MAC activa y se convierte en el adaptador activo. Cuando el adaptador activo anterior vuelve a entrar en servicio, asume la función del adaptador de reserva, incluida su dirección MAC. Los hosts remotos que se comunican con el módulo a través de la interfaz IP ven, en el peor de los casos, un retraso de un segundo más o menos durante la transición.
El problema es que no basta con configurar el VOS, los interruptores de red a los que se conectan los adaptadores en espera y activos también deben estar configurados correctamente. Por lo general, esto no es un problema cuando se configura por primera vez la asociación activa/en espera, pero con el tiempo es posible que la configuración del conmutador mute de manera que no dañe las comunicaciones actuales pero impida un fallo sin problemas cuando la VOS cambie el estado del adaptador en espera a activo.
Hay tres formas de descubrir que estas mutaciones de configuración de los interruptores han ocurrido.
La primera es cuando el adaptador activo falla y VOS cambia el estado del adaptador de reserva a activo. En este punto los anfitriones remotos ya no pueden comunicarse con el módulo a través de esa interfaz y se tiene un adaptador fallido. He visto esta situación muchas veces, no es bonita.
La segunda forma es revisar la configuración del interruptor. Esto implica hacer que el administrador de la red revise una configuración que funcione buscando algo que pueda causar un problema - buena suerte.
La tercera es para probar. Puedes usar el comando dlmux_admin para forzar una falla o en algún hardware puedes físicamente tirar del adaptador del módulo o usar un comando VOS para desactivar el adaptador pero yo prefiero simplemente desconectar el adaptador activo de la red. Si tienes una conexión activa con el módulo ya establecida deberías ser capaz de decir en segundos si el fail over fue perfecto o no. Haciendo esto en el momento que usted elija, puede elegir el momento en que será menos perturbador si el fail over no es perfecto. Además, como el adaptador sigue funcionando, la recuperación es sencilla: vuelva a conectar el cable y desenchufe el adaptador recién activado, espere a que se produzca el otro fallo y vuelva a conectar el adaptador en espera.
Si la prueba muestra que el fallo no es perfecto, tienes el lujo de trabajar con el administrador de la red en un problema demostrado sin que nadie exija saber cuánto tiempo falta para arreglarlo. Si la prueba fue perfecta, está todo listo. Como el título de este blog sugiere, recomiendo hacer la prueba periódicamente, digamos el primer lunes del mes.