Was ist ein InfiniBand®?
InfiniBand® ist ein Netzwerkkommunikations- und Speichersystem, das serielle Hochgeschwindigkeitsverbindungen und -prozessoren verwendet, um die Belange der Leistung und Zuverlässigkeit für Hochleistungscomputer zu berücksichtigen. Es kann 64.000 Knoten adressieren und bietet Geschwindigkeiten von bis zu 2,5 Gigabit pro Sekunde (Gbit / s). Diese Geschwindigkeit beträgt ungefähr 2.500 Millionen Bits pro Sekunde (Mbit / s), wodurch eine 1-Gigabit-Datei in weniger als 4 Sekunden heruntergeladen werden kann.
Die jetzt verfügbaren seriellen Hochgeschwindigkeitsverbindungen, wie z. B. Glasfaser, machen InfiniBand® teilweise möglich. Zu Beginn der Datenverarbeitung galt die serielle Kommunikation als zu langsam für schnelle Datenübertragungsraten, und es standen nur Computerbusse zur Auswahl, die zumeist parallel waren. Schnelle serielle Verbindungen und serielle Busse sind sehr praktisch und die Fehlerquellen bei der Hardware sind geringer. In einem 32-Bit-Parallelbus sind beispielsweise mindestens 32 Sätze von Bittreibern und meist Druckkontakte zwischen Schnittstellenkarten vorhanden. Die Ausfallwahrscheinlichkeit ist dann bei Parallelgeräten insofern höher.
InfiniBand® bietet auch Redundanz für erhöhte Zuverlässigkeit. Die Speichergeräte und Hosts in InfiniBand® können für einen optimierten Schutz geografisch verteilt sein. Beispielsweise kann eine umfangreiche Datenbankanwendung, die eine Verfügbarkeit von 24 x 7 oder 100% erfordert, viele Techniken in Betracht ziehen, einschließlich Standortredundanz, Serverredundanz und Speicherredundanz.
Die Standortredundanz repliziert einen gesamten Anwendungsstandort, der gleichzeitig mit dem Hauptanwendungsstandort funktioniert. Dies scheint zunächst Computer- und Computernetzwerkressourcen zu verschwenden. Die Weisheit in der Vorgehensweise wird beobachtet, wenn ein Vorgang an der primären Anwendungsstelle teilweise oder vollständig unterbrochen wird. Eine Sicherungssite, die immer mit der primären Site zusammenarbeitet, wird dann als Hauptsite heraufgestuft und so lange verarbeitet, bis die Hauptsite aktiv und online ist.
Die Server-Redundanz repliziert den primären Server, um im Falle eines Ausfalls den fortgesetzten Betrieb sicherzustellen. Unabhängig davon, ob der primäre Server am selben Ort oder von einem anderen entfernt ist, kann der sekundäre Server parallel betrieben werden, sodass ein schwerwiegender Ausfall des primären Servers den Dienst nicht stört. Bei der Festplattenspiegelung wird der lokale Speicher des Servers auf zwei Speichersystemen geschrieben, während bei der Standortspiegelung der Sicherungsstandort die Aufgabe des Primärservers übernimmt und mit diesem synchronisiert.
Eine Switched Fabric-Kommunikationsverbindung kann die für Supercomputer erforderlichen Gesamtbandbreiten für Geräte bereitstellen. Fabric bezieht sich auf ein relativ großes Netzwerk von Hosts und Netzwerkgeräten, die miteinander verbunden sind. In einer Switched Fabric werden Remote-Hochgeschwindigkeitsspeicher und schnelle Remote-Host-Dienste durch Switching-Technologien verbessert, die den Rechenaufwand und die Kollisionen reduzieren, wenn Datenpakete in das Netzwerk gesendet werden.