¿Qué es un InfiniBand®?
InfiniBand® es un sistema de comunicaciones y almacenamiento en red que utiliza enlaces y procesadores seriales de alta velocidad para abordar las preocupaciones de rendimiento y confiabilidad para la computación de alto rendimiento. Es capaz de direccionar 64,000 nodos, y puede proporcionar velocidades de hasta 2.5 gigabits por segundo (Gbps). Esta velocidad es de aproximadamente 2.500 millones de bits por segundo (Mbps), que puede descargar un archivo de 1 gigabit en menos de 4 segundos.
Los enlaces seriales de alta velocidad ahora disponibles, como la fibra óptica, hacen posible en parte InfiniBand®. En la informática temprana, las comunicaciones en serie se consideraban demasiado lentas para velocidades de transferencia de datos rápidas, y los buses de computadora, que eran en su mayoría paralelos, eran la única opción. Los enlaces seriales rápidos y los buses seriales son muy prácticos, y los puntos de falla en el hardware son menores. En un bus paralelo de 32 bits, por ejemplo, hay al menos 32 conjuntos de controladores de bits y, con mayor frecuencia, contactos de presión involucrados entre las tarjetas de interfaz. La probabilidad de falla es entonces mayor en dispositivos paralelos a este respecto.
InfiniBand® también ofrece redundancia para una mayor confiabilidad. Los dispositivos de almacenamiento y los hosts en InfiniBand® pueden distribuirse geográficamente para una protección optimizada. Por ejemplo, una aplicación de base de datos masiva que requiere 24 x 7, o 100% de tiempo de actividad, puede considerar muchas técnicas, incluida la redundancia del sitio, la redundancia del servidor y la redundancia de almacenamiento.
La redundancia del sitio replica un sitio de aplicación completo que funciona al mismo tiempo que el sitio de aplicación principal, lo que puede parecer que al principio desperdicia recursos informáticos y de redes de computadoras. La sabiduría en el enfoque se observa cuando una operación en el sitio de aplicación principal se ve interrumpida parcial o totalmente. Un sitio de respaldo que siempre funciona junto con el sitio primario se promociona como el sitio principal y continúa procesándose hasta que el sitio principal esté activo y en línea.
La redundancia del servidor replica el servidor primario para garantizar la operación continua en caso de falla. Ya sea colocado o remoto desde el primario, el servidor secundario puede estar en operación paralela para que cualquier falla importante en el servidor primario no interrumpa el servicio. En la duplicación de disco, el almacenamiento local del servidor se escribe en dos sistemas de almacenamiento, mientras que en la duplicación del sitio, el sitio de respaldo hace el trabajo del servidor primario y se sincroniza con él.
Un enlace de comunicaciones de estructura conmutada es capaz de entregar los anchos de banda de dispositivo generales necesarios que necesitan las supercomputadoras. Fabric se refiere a una red relativamente grande de hosts y dispositivos de red que están interconectados entre sí. En una estructura conmutada, el almacenamiento remoto de alta velocidad y los servicios de host remotos rápidos se mejoran mediante tecnologías de conmutación que reducen la sobrecarga informática y las colisiones cuando se envían paquetes de datos a la red.