O que é um InfiniBand®?
O InfiniBand® é um sistema de comunicação e armazenamento em rede que utiliza links e processadores seriais de alta velocidade para tratar das preocupações de desempenho e confiabilidade da computação de alto desempenho. Ele é capaz de endereçar 64.000 nós e pode fornecer velocidades de até 2,5 gigabits por segundo (Gbps). Essa velocidade é de cerca de 2.500 milhões de bits por segundo (Mbps), que pode baixar um arquivo de 1 gigabit em menos de 4 segundos.
Os links seriais de alta velocidade agora disponíveis, como fibra ótica, tornam parcialmente possível o InfiniBand®. No início da computação, as comunicações seriais eram consideradas muito lentas para taxas de transferência de dados rápidas, e os ônibus de computador, que eram quase sempre paralelos, eram a única opção. Links seriais rápidos e barramentos seriais são muito práticos e os pontos de falha no hardware são menores. Em um barramento paralelo de 32 bits, por exemplo, existem pelo menos 32 conjuntos de drivers de bits e, na maioria das vezes, contatos de pressão envolvidos entre as placas de interface. A probabilidade de falha é então maior em dispositivos paralelos a esse respeito.
O InfiniBand® também oferece redundância para aumentar a confiabilidade. Os dispositivos e hosts de armazenamento no InfiniBand® podem ser distribuídos geograficamente para proteção otimizada. Por exemplo, um aplicativo de banco de dados massivo que requer tempo de atividade 24x7 ou 100% pode considerar muitas técnicas, incluindo redundância de site, redundância de servidor e redundância de armazenamento.
A redundância do site replica um site inteiro do aplicativo que funciona ao mesmo tempo que o site principal do aplicativo, que pode parecer desperdiçar recursos de computação e redes de computadores a princípio. A sabedoria da abordagem é observada quando uma operação no site de aplicativo primário é parcial ou totalmente interrompida. Um site de backup que sempre trabalha em conjunto com o site principal é promovido como o site principal e continua o processamento até o site principal estar ativo e online.
A redundância do servidor replica o servidor principal para garantir a operação contínua no caso de uma falha. Colocado ou remoto do primário, o servidor secundário pode estar em operação paralela para que qualquer falha grave no servidor primário não interrompa o serviço. No espelhamento de disco, o armazenamento local do servidor é gravado em dois sistemas de armazenamento, enquanto no espelhamento de site, o site de backup executa o trabalho do servidor principal e sincroniza com ele.
Um link de comunicação de malha comutada é capaz de fornecer as larguras de banda de dispositivo necessárias para os supercomputadores. Fabric refere-se a uma rede relativamente grande de hosts e dispositivos de rede interconectados. Em uma malha comutada, o armazenamento remoto de alta velocidade e os serviços de host remoto rápido são aprimorados com as tecnologias de comutação que reduzem a sobrecarga de computação e as colisões quando os pacotes de dados são enviados para a rede.