NVIDIA Rubin: Die Hardware für die Zeit nach dem Chatbot

NVIDIA Rubin: Start 2026. Alles zur neuen Plattform für Agentic AI, HBM4-Speicher und dem Supercomputer „Blue Lion“ in München.
Futuritsisches Bild eines Computerchips von Nvidia mit dem Namen Rubin
Während viele Unternehmen noch ihre Infrastruktur für die Blackwell-Generation aufbauen, hat NVIDIA CEO Jensen Huang auf der CES 2026 bereits den Nachfolger präsentiert: Die Rubin-Plattform. Der Fokus verschiebt sich dabei technologisch. Ging es bisher primär um schnelleres Training von Modellen, zielt Rubin auf das wirtschaftliche Betreiben von Agentic AI ab – also Software, die nicht nur auf Eingaben reagiert, sondern Aufgaben über längere Zeiträume selbstständig plant und ausführt.

Die Technik hinter NVIDIA RUbin: Ein Verbundsystem statt einzelner GPUs

Rubin funktioniert nicht als isolierte Grafikkarte. NVIDIA setzt auf „Extreme Co-Design“, bei dem sechs Komponenten fest verzahnt arbeiten, um Datenstaus zu vermeiden. Die technischen Eckdaten:

  • Speicher (HBM4): Die Rubin GPU nutzt erstmals High Bandwidth Memory 4. Mit einer Bandbreite von 22 Terabyte pro Sekunde adressiert NVIDIA den Hauptengpass aktueller Systeme: den Datentransport zwischen Speicher und Rechenkern.
  • Vera CPU: Ein neuer Hauptprozessor, benannt nach der Astronomin Vera Rubin. Er ist spezifisch für die Verwaltung der Datenströme in großen KI-Clustern konzipiert und entlastet die GPUs.
  • Vernetzung (NVLink 6): Der neue Switch ermöglicht Kommunikationsgeschwindigkeiten von bis zu 3,6 TB/s pro GPU. Ergänzt wird dies durch ConnectX-9 SuperNICs (1.6 Tb/s), damit Tausende dieser Chips wie ein einziger Computer agieren.

Warum das relevant ist: Kostenfaktor Inferenz

Aktuelle „Reasoning“-Modelle (Modelle, die logische Schlussfolgerungen ziehen) benötigen viel Rechenzeit während der Antwortphase. Auf derzeitiger Hardware ist dieser Prozess teuer und langsam.

NVIDIA nennt für Rubin folgende Vergleichswerte zur Blackwell-Architektur:

  • 10-fach geringere Kosten im laufenden Betrieb (Inferenz)
  • 5-fache Leistung bei der Modellausführung
  • 3-fache Leistung beim Training neuer Modelle

Diese Effizienzsteigerung ist die Voraussetzung, damit komplexe KI-Agenten in Unternehmen operativ und kostendeckend eingesetzt werden können.

NVIDIA Rubin in Deutschland: Projekt „Blue Lion“

Die Technologie kommt zeitnah in Deutschland zum Einsatz. Das Leibniz-Rechenzentrum (LRZ) der Bayerischen Akademie der Wissenschaften in Garching plant den Supercomputer „Blue Lion“.

Das System wird auf der NVIDIA Vera-Rubin-Architektur basieren. Anders als bei kommerziellen Chatbots liegt der Fokus hier auf „AI for Science“: Simulationen in der Astrophysik, Klimaforschung und Fusionsenergie. Deutschland sichert sich damit direkten Zugang zur aktuellsten Hardware-Generation für die wissenschaftliche Forschung.

Zeitplan

Laut NVIDIA läuft die Produktion bereits. Die Auslieferung der Systeme über Partner sowie die Verfügbarkeit in Clouds wie AWS oder Azure beginnt in der zweiten Jahreshälfte 2026.

Quelle: https://www.nvidia.com/de-de/data-center/technologies/rubin/

Aleksej Siebenhaar
Mit umfangreicher Erfahrung in der KI-Anwendung unterstützt Aleksej Unternehmen dabei, durch den Einsatz von KI ihre Effizienz zu steigern und Prozesse zu automatisieren. Er ist zertifizierter Projektmanager und Ausbilder. Seine Leidenschaft für KI wird ergänzt durch sein Interesse an Technologie, das er durch kontinuierliche Weiterbildung in den Bereichen Automatisierung, Prozess- und Projektmanagement vertieft. Seine Fähigkeit, komplexe technische Konzepte verständlich und zugänglich zu machen, wurde durch seine langjährige Tätigkeit als Personal Trainer und Dozent für eine Fitnesstrainer Akademie geschärft. Diese Erfahrung hat ihm wertvolle Methoden im Bereich der effektiven Wissensvermittlung vermittelt. Als Mitgründer von AI-Compact teilt Aleksej seine Expertise und Leidenschaft durch gut recherchierte Artikel, praxisnahe Anleitungen und aktuelle Informationen über die neuesten Entwicklungen und Tools im Bereich der KI.