Redes e Servidores: Armazenamento de Alta Disponibilidade (II)

Storage Area Network

Uma Storage Area Network (SAN) é uma sub-rede de alto desempenho dedicada que oferece acesso a armazenamento de dados consolidado ao nível de bloco, e é usada principalmente para a transferência de dados entre sistemas de computadores e elementos de armazenamento e entre os próprios elementos de armazenamento, fazendo com que dispositivos de armazenamento, como conjuntos de discos, bibliotecas de fitas, e torres de armazenamento óptico estejam acessíveis aos servidores de modo a que os dispositivos apareçam como dispositivos locais ligados ao sistema operativo.

Uma SAN normalmente tem a sua própria infra-estrutura de comunicação, que geralmente não é acessível por outros dispositivos através da rede de área local. A SAN move dados entre vários dispositivos de armazenamento, permitindo a partilha de dados entre servidores diferentes, e fornece um meio de ligação rápido para backup, restauro, arquivo e recuperação de dados. Os dispositivos da SAN são normalmente instalados numa sala individual, mas também podem ser ligados a longas distâncias, tornando-os muito úteis para grandes empresas.

Benefícios das SAN

Os principais benefícios de uma SAN são:

Alta Disponibilidade: Uma cópia de quaisquer dados está sempre acessível a todos e quaisquer clientes via múltiplos caminhos;
Fiabilidade: O transporte de dados fiável assegura uma baixa taxa de erro e capacidades de tolerância a falhas;
Escalabilidade: Servidores e dispositivos de armazenamento podem ser adicionados de forma independente uns dos outros e de quaisquer sistemas proprietários;
Desempenho: Fibre Channel (o método padrão para a interligação nas SAN) tem agora mais de 2000MB/seg de largura de banda e separa as E/S de armazenamento e de rede.

SAN e LAN

Uma vez que os protocolos TCP/IP originais usados nas LAN foram desenvolvidos para mover e partilhar ficheiros, eles não tinham embutida nenhuma forma de aceder directamente aos discos. Em resultado disso, aplicações de muito alto desempenho necessitavam acesso directo a unidades de disco baseadas em blocos para mover e armazenar dados muito rapidamente, uma vez que os dados são armazenados como blocos numa unidade de disco.

Uma SAN difere de uma LAN principalmente em dois aspectos:

Protocolo de Armazenamento: A LAN usa protocolos de rede que enviam pequenos blocos de dados com a sobrecarga de comunicação aumentada pelo endereçamento e pelo encapsulamento do protocolo o que reduz o débito de informação. A SAN usa protocolos de armazenamento (SCSI) que enviam grandes blocos de dados com sobrecarga reduzida e maior débito de informação;

Armazenamento Cativo dos Servidores: Os sistemas baseados em LANs ligam os servidores aos clientes com cada servidor a possuir e controlar o acesso aos seus recursos de armazenamento próprio. O armazenamento deve ser adicionado a um servidor ao invés de directamente à LAN. A SAN permite que os recursos de armazenamento possam ser adicionados à rede permitindo que qualquer servidor lhes possa aceder directamente.

Protocolos das SAN

Existem quatro principais protocolos utilizados nas SANs:

Protocolo Fibre Channel:

Os profissionais de TI usam a expressão Fibre em vez de Fiber para se referirem especificamente a cabos de fibra óptica usados numa SAN. A ideia é diferenciar os cabos da SAN dos cabos ópticos usados noutras redes (como as redes TCP/IP) e é por isso que o principal protocolo usado numa SAN é chamado Fibre Channel.

Esta é a linguagem usado pelos Host Bus Adapters, hubs, switches e controladores de armazenamento para falarem uns aos outros numa SAN. O protocolo Fibre Channel é uma linguagem de baixo nível, ou seja, é o meio de comunicação entre os componentes do hardware e não entre as aplicações que correm no hardware. O Fibre Channel é o alicerce básico de construção da SAN; imagine o Fibre Channel como a estrada onde o SCSI é o camião que move a carga de dados pela estrada.

Protocolo SCSI:

SCSI significa Small Computer System Interface e é um conjunto de padrões para ligar fisicamente e transferir dados entre computadores e dispositivos periféricos. Os padrões SCSI definem comandos, protocolos e interfaces eléctricas e ópticas e são usados principalmente para discos rígidos e sistemas de fita mas podem ligar uma ampla gama de outros dispositivos, incluindo scanners e unidades de CD.

Esta é a linguagem usada pelas aplicações executados em servidores ligados a uma SAN para acederem às unidades de disco. Este protocolo está em cima do protocolo Fibre Channel. Embora actualmente a maioria dos fabricantes já utilizem discos Fibre Channel nos seus conjuntos de armazenamento, os discos em si ainda usam o velho protocolo SCSI para comunicarem com as aplicações na rede Fibre Channel. Todas as mensagens SCSI são encapsuladas no protocolo Fibre Channel.

Protocolo iSCSI

O Internet SCSI é uma alternativa de baixo custo ao Fibre Channel que é considerado mais fácil de gerir e ligar porque usa o protocolo TCP/IP comum e switches Ethernet comuns. Outra vantagem do iSCSI é que, devido a utilizar o TCP/IP, pode ser encaminhado por diferentes sub-redes, o que significa que pode ser usado numa WAN para espelhamento de dados e recuperação de desastres.
A desvantagem do iSCSI é que é computacionalmente caro para alto débito de armazenamento porque tem que encapsular o protocolo SCSI em pacotes TCP. Isso significa que, ou implica alta utilização da CPU (não é problema com os modernos processadores multicore) ou requer uma placa de rede cara com TOE (TCP Offloading Engine) instalada no hardware.

Protocolo AoE

O protocolo ATA over Ethernet foi a mais recente tecnologia SAN a emergir, criado como uma alternativa ainda de mais baixo custo que o iSCSI. O AoE é uma tecnologia que encapsula comandos ATA em frames Ethernet de baixo nível e evita a utilização do TCP/IP. Isso significa que nem sobrecarrega a CPU nem exige placas de rede de topo de gama com capacidade TOE para suportar armazenamento de alto débito. Isso faz com que o AoE seja uma alternativa de alto desempenho e de custo muito baixo, tanto para o Fibre Channel como para o iSCSI. Como o AoE não usa TCP/IP, não é uma tecnologia encaminhável mas a verdade é que as SAN com Fibre Channel também não o são.

Armazenamento SAN

O nível de armazenamento é o lugar onde residem todos os dados na SAN. Este é o nível que contém todas as unidades de disco, unidades de fita e outros dispositivos de armazenamento, como drives de armazenamento óptico. Os dispositivos do nível de armazenamento incluem alguma inteligência, tal como RAID ou outras tecnologias de replicação de dados para proteger a informação em caso de ocorrer uma falha.

Se utilizar um conjunto de discos sem qualquer ligação especial entre eles, é apenas um monte de discos (também chamado de JBOD: Just a Bunch Of Disks) todos localizados no mesmo lugar. Mas um conjunto de armazenamento adiciona inteligência extra aos controladores o que lhe permite fazer coisas interessantes como o RAID e deixar de ser apenas um monte de discos estúpido. A inteligência incorporada nos controladores do conjunto de armazenamento é o que permite essa funcionalidade adicional e isso é conseguido através de um código chamado firmware que os torna mais inteligentes.

Conjuntos Modulares

Este tipo de conjuntos tem menos portas de ligação que os conjuntos monolíticos pois geralmente armazenam menos dados e ligam-se a menos servidores. São projectados de modo a poderem começar pequenos, com apenas algumas unidades de disco, adicionando mais unidades ao conjunto à medida que as necessidades de armazenamento crescem. Os conjuntos modulares vêm com prateleiras que sustentam as unidades de disco e cada prateleira pode conter entre 10 a 16 unidades, geralmente encaixando nos armários padrão de 19”, para que seja possível ter todos os servidores e discos da SAN no mesmo armário.

Os conjuntos modulares são perfeitos para as pequenas empresas que procuram instalar uma SAN com um orçamento limitado, mas também são bons para as grandes empresas com muitos escritórios remotos, porque eles são muito mais baratos e menores do que os grandes conjuntos monolíticos, e assim podem ser colocados em pequenos escritórios. Os conjuntos modulares utilizam quase sempre dois controladores, com memória cache separada em cada controlador, e depois replicam a cache entre os controladores para evitar perda de dados. Os conjuntos modulares mais modernos podem ter entre 16 e 32 GB de memória cache.

Conjuntos Monolíticos

Conjuntos monolíticos são aquelas grandes colecções de unidades de disco, do tamanho de um frigorífico, que normalmente se encontram ao lado dos mainframes num centro de dados. Os conjuntos monolíticos podem acomodar centenas de unidades de disco, armazenar muito mais dados para servidores do que um conjunto modular e geralmente ligam-se a mainframes.

Estes conjuntos de discos estão carregados de tecnologia avançada para fornecer tolerância a falhas à prova de bala. Os conjuntos monolíticos têm muitos controladores e estes podem partilhar o acesso directo a uma cache de memória global (até centenas de gigabytes) de grande velocidade. Este método de partilha de acesso a uma grande cache global ou monolítica é a razão de ser do nome destes conjuntos.

Network Attached Storage

O Network Attached Storage (NAS) é um armazenamento de dados ao nível de ficheiro ligado a uma rede de computadores que oferece acesso de dados a clientes heterogéneos. O NAS é um dispositivo de armazenamento único que funciona sobre ficheiros de dados, enquanto uma SAN é uma rede local de vários dispositivos que operam em blocos de disco. Um sistema NAS tem seu próprio endereço IP na LAN e o seu próprio software para configurar e mapear localizações de ficheiros para os dispositivos ligados à rede. Sistemas NAS contêm um ou mais discos rígidos, geralmente organizados em conjuntos RAID redundantes e utiliza protocolos baseados em ficheiros como o NFS (popular em sistemas UNIX), SMB/CIFS (Server Message Block/Common Internet File System, usado com sistemas MS Windows ), ou o AFP (utilizado com computadores Apple Macintosh).

Em suma, o NAS é outro servidor na rede e pode, em muitos casos, substituir completamente um servidor de ficheiros convencional com um sistema de armazenamento Direct Attached System (DAS), especialmente se o único papel desse servidor é o de partilhar ficheiros. O NAS não só funciona como um servidor de ficheiros como é especializado para esta tarefa, quer pelo seu hardware, software ou a configuração desses elementos. O NAS é muitas vezes feito como uma appliance, isto é, um computador especializado e construído a partir do zero para armazenar e servir ficheiros arquivos em vez de ser simplesmente um computador de uso geral a ser utilizado para esse papel. Por esta razão, as unidades NAS geralmente não têm um teclado nem monitor e são controladas e configuradas através da rede, muitas vezes usando um browser.

SAN vs NAS

À primeira vista, NAS e SAN podem parecer quase idênticas, e na verdade muitas vezes ambas poderão ser utilizadas numa determinada situação. No entanto, existem diferenças que podem afectar seriamente a forma como os dados são utilizados.

Enquanto uma SAN lida com blocos de dados, um NAS opera ao nível do ficheiro e é acessível a qualquer pessoa com privilégios de acesso, por isso precisa também de gerir privilégios de utilizador, bloqueio de ficheiros e outras medidas de segurança. O processamento e controle destes dados são realizados em sistemas de grandes empresas por uma “NAS head”, fisicamente separada do sistema de armazenamento.

Em contraste, as SANs permitem que vários servidores partilhem um armazenamento, fazendo com que pareça ao servidor como se fosse local ou DAS, e não pode ser acedido por utilizadores individuais. A SAN utiliza normalmente ligações físicas Fibre Channel e encapsulamento SCSI enquanto um NAS normalmente faz uso de ligações Ethernet e TCP/IP com NFS/CIFS/AFP como protocolos de comunicação.