Alta Disponibilidade – Redes (II)

Protocolos Redundantes


Se leu os artigos anteriores a sua rede já tem ligações redundantes e portanto resta agora decidir como irão os pacotes seleccionar os caminhos na rede de forma a evitar loops. Isto não é um problema novo; caminhos redundantes foram abordados por protocolos como o Spanning Tree Protocol (STP) na camada 2 e protocolos de endereçamento como o Open Shortest Path First ( OSPF) na Camada 3. Mas esses protocolos podem levar 40 segundos ou mais para convergir e isto é inaceitável para redes críticas, especialmente aquelas com aplicações em tempo real, como VoIP e vídeo.

O STP é um protocolo de gestão de ligações (comutação) que fornece redundância de caminhos, evitando loops indesejáveis na rede. Para uma rede Ethernet funcionar correctamente, apenas pode existir um caminho activo entre duas estações. Este protocolo deve ser utilizado em situações onde se querem ligações redundantes, mas não loops. Ligações redundantes são tão importantes como backups em caso de falha numa rede. Uma falha do router principal activa as ligações de backup para que os utilizadores possam continuar a usar a rede. Sem STP nas bridges e switches, tal falha pode resultar num loop.

Para fornecer redundância de caminhos, o STP define uma árvore de ligações que abarca todos os switches numa rede e força determinados caminhos redundantes a ficarem em estado de espera (bloqueados). Se um segmento de rede no protocolo STP se tornar inacessível, ou se o STP alterar os custos dessa ligação, o algoritmo spanning-tree reconfigura a topologia da árvore de ligações e restabelece a ligação activando um dos caminhos em espera.

Uma versão actualizada do STP é o chamado RSTP (Rapid Spanning Tree Protocol) que reduz o tempo de convergência do STP para cerca de um segundo. Uma das desvantagens deste RSTP (e do STP) é que apenas uma das ligações redundantes pode ser colocada em "espera activa", outra é que quando o STP muda o caminho activo para outro router, então os endereços de gateway dos clientes também têm que mudar.

Para evitar esses problemas, deve ser utilizado o Virtual Router Redundancy Protocol (VRRP) em conjunto com o STP ou o RSTP nos routers, que simula um endereço virtual de encaminhamento para os routers principais e leva cerca de três segundos para fazer o failover.A vantagem de usar VRRP é que se ganha uma maior disponibilidade para o caminho padrão, sem necessidade de configuração de protocolos de encaminhamento dinâmico ou de descoberta de routers em cada host.

Os routers VRRP vistos como um "grupo de redundância" partilham a responsabilidade do encaminhamento de pacotes, como se fossem proprietários do endereço IP correspondente ao gateway padrão configurado nos hosts. Um dos routers VRRP actua como mestre e os outros como backups; se o router mestre falhar, um dos backups torna-se o novo mestre. Desta forma, a redundância do router é sempre garantida, permitindo que o tráfego na rede local seja encaminhado sem depender de um único router.

Mas como o VRRP e o RSTP trabalham de forma independente, é possível que o VRRP designe um router como mestre e o RSTP determine que o caminho para o router de backup é o caminho preferencial. No pior caso, isto significa que se o router backup receber tráfego, vai enviá-lo imediatamente para o router mestre para processamento, acrescentando assim um router ao caminho.
O Common Address Redundancy Protocol (CARP) é uma melhoria sobre o VRRP e é também uma ferramenta para ajudar a criar redundância, por ter vários computadores a criar uma única interface de rede virtual entre eles, de modo que se qualquer máquina falhar, o outro pode responder em vez disso, permitindo ainda um grau de partilha de carga entre os sistemas.



Outra opção para a redundância dos routers é utilizar o OSPF no router principal, assim como nos switches de agregação. O OSPF é um protocolo de encaminhamento usado para permitir que os routers aprendam dinamicamente caminhos a partir de outros routers e para anunciar esses caminhos para outros routers. Um router OSPF mantém o controle do estado das várias ligações de rede entre si e a rede para onde está a tentar enviar dados ou seja, o OSPF é um protocolo de estado de ligações (link state) e portanto, se uma das ligações cai, ele normalmente falha em menos de um segundo. Não é necessário utilizar o VRRP com OSPF a não ser que existam switches agregadores, porque os clientes usariam o switch agregador como o seu único endereço de gateway.

A maioria das implementações actuais do OSPF em routers e switches suporta agora o Equal Cost Multipath (ECMP), uma nova versão do OSPF que equilibra a carga de tráfego igualmente entre duas ligações que estão sempre activas numa configuração activa/activa e, se houver uma falha, apenas metade do tráfego será afectado. O balanceamento de carga também significa que, teoricamente, está disponível a totalidade da largura de banda de ambas as ligações. Mas, depender de ambas as ligações para suprir as necessidades de largura de banda não é redundância total.

Uma maneira simples de adicionar redundância entre dois switches é usar o protocolo 802.3ad (Link aggregation). Este protocolo de trunking usa várias ligações e combina-as numa única (pipe) virtual para aumentar a largura de banda e a redundância garantindo assim uma maior disponibilidade. Os pacotes são distribuídos entre as ligações e assim, se uma deles cair, o tráfego será direccionado para uma das ligações remanescentes.

O Hot Standby Router Protocol (HSRP) fornece um mecanismo que é projectado para suportar failover tráfego IP sem interrupções de, em determinadas circunstâncias. Em particular, o protocolo protege contra a falha do router do primeiro salto, quando o host de origem não pode saber o endereço IP do router do primeiro salto dinamicamente e, além disso, o HSRP não foi concebido como um substituto para os actuais mecanismos de descoberta dinâmica de router.