Die Technik hinter NVIDIA RUbin: Ein Verbundsystem statt einzelner GPUs
Rubin funktioniert nicht als isolierte Grafikkarte. NVIDIA setzt auf „Extreme Co-Design“, bei dem sechs Komponenten fest verzahnt arbeiten, um Datenstaus zu vermeiden. Die technischen Eckdaten:
- Speicher (HBM4): Die Rubin GPU nutzt erstmals High Bandwidth Memory 4. Mit einer Bandbreite von 22 Terabyte pro Sekunde adressiert NVIDIA den Hauptengpass aktueller Systeme: den Datentransport zwischen Speicher und Rechenkern.
- Vera CPU: Ein neuer Hauptprozessor, benannt nach der Astronomin Vera Rubin. Er ist spezifisch für die Verwaltung der Datenströme in großen KI-Clustern konzipiert und entlastet die GPUs.
- Vernetzung (NVLink 6): Der neue Switch ermöglicht Kommunikationsgeschwindigkeiten von bis zu 3,6 TB/s pro GPU. Ergänzt wird dies durch ConnectX-9 SuperNICs (1.6 Tb/s), damit Tausende dieser Chips wie ein einziger Computer agieren.
Warum das relevant ist: Kostenfaktor Inferenz
Aktuelle „Reasoning“-Modelle (Modelle, die logische Schlussfolgerungen ziehen) benötigen viel Rechenzeit während der Antwortphase. Auf derzeitiger Hardware ist dieser Prozess teuer und langsam.
NVIDIA nennt für Rubin folgende Vergleichswerte zur Blackwell-Architektur:
- 10-fach geringere Kosten im laufenden Betrieb (Inferenz)
- 5-fache Leistung bei der Modellausführung
- 3-fache Leistung beim Training neuer Modelle
Diese Effizienzsteigerung ist die Voraussetzung, damit komplexe KI-Agenten in Unternehmen operativ und kostendeckend eingesetzt werden können.
NVIDIA Rubin in Deutschland: Projekt „Blue Lion“
Die Technologie kommt zeitnah in Deutschland zum Einsatz. Das Leibniz-Rechenzentrum (LRZ) der Bayerischen Akademie der Wissenschaften in Garching plant den Supercomputer „Blue Lion“.
Das System wird auf der NVIDIA Vera-Rubin-Architektur basieren. Anders als bei kommerziellen Chatbots liegt der Fokus hier auf „AI for Science“: Simulationen in der Astrophysik, Klimaforschung und Fusionsenergie. Deutschland sichert sich damit direkten Zugang zur aktuellsten Hardware-Generation für die wissenschaftliche Forschung.
Zeitplan
Laut NVIDIA läuft die Produktion bereits. Die Auslieferung der Systeme über Partner sowie die Verfügbarkeit in Clouds wie AWS oder Azure beginnt in der zweiten Jahreshälfte 2026.
Quelle: https://www.nvidia.com/de-de/data-center/technologies/rubin/