Das ist es AWS re:Invent Diese Woche findet Amazons jährliche Cloud-Computing-Spektakel in Las Vegas statt, und wie es Tradition ist, hat das Unternehmen so viel zu verkünden, dass es nicht alles in seinen fünf (!) Keynotes unterbringen kann. Vor der offiziellen Eröffnung der Veranstaltung stellte AWS am Montag eine Reihe von Aktualisierungen seiner gesamten Rechenzentrumsstrategie vor, die es wert sind, beachtet zu werden.
Das wichtigste davon ist, dass AWS bald damit beginnen wird, Flüssigkeitskühlung für seine KI-Server und andere Maschinen einzusetzen, unabhängig davon, ob diese auf seinen intern entwickelten Trainium-Chips und Nvidia-Beschleunigern basieren. Konkret weist AWS darauf hin, dass seine Trainium2-Chips (die sich noch in der Vorschau befinden) und „Rack-Scale-KI-Supercomputing-Lösungen wie NVIDIA GB200 NVL72“ auf diese Weise gekühlt werden.
Es ist erwähnenswert, dass AWS betont, dass diese verbesserten Kühlsysteme Luft- und Flüssigkeitskühlung integrieren können. Schließlich gibt es in Rechenzentren noch viele andere Server, die beispielsweise für die Vernetzung und Speicherung zuständig sind und keine Flüssigkeitskühlung benötigen. „Dieses flexible, multimodale Kühldesign ermöglicht es AWS, maximale Leistung und Effizienz zu niedrigsten Kosten zu liefern, unabhängig davon, ob herkömmliche Workloads oder KI-Modelle ausgeführt werden“, erklärt AWS.
Das Unternehmen gab außerdem bekannt, dass es bei seinen Servern und Server-Racks auf einfachere elektrische und mechanische Designs umsteigen wird.
„Zu den neuesten Designverbesserungen des AWS-Rechenzentrums gehören vereinfachte elektrische Verteilungs- und mechanische Systeme, die eine Infrastrukturverfügbarkeit von 99,9999 % ermöglichen. Vereinfachte Systeme reduzieren außerdem die potenzielle Anzahl von Racks, die von elektrischen Problemen betroffen sein könnten, um 89 %“, stellt das Unternehmen in seiner Ankündigung fest. AWS erreicht dies zum Teil dadurch, dass es die Anzahl der Stromumwandlungen auf dem Weg vom Stromnetz zum Server reduziert.
AWS hat nicht viel mehr Details bereitgestellt, aber das bedeutet wahrscheinlich, dass für den Betrieb der Server und/oder des HLK-Systems Gleichstrom verwendet wird und viele der Schritte zur Umwandlung von Wechselstrom in Gleichstrom in Wechselstrom (mit ihren Standardverlusten) vermieden werden, die andernfalls erforderlich wären . notwendig.
„AWS entwickelt seine Infrastruktur unermüdlich weiter, um die leistungsstärkste, belastbarste, sicherste und nachhaltigste Cloud für Kunden auf der ganzen Welt aufzubauen“, sagte Prasad Kalyanaraman, Vizepräsident für Infrastrukturdienste bei AWS, in der Ankündigung vom Montag. „Diese Rechenzentrumsfunktionen stellen einen wichtigen Fortschritt mit größerer Energieeffizienz und flexibler Unterstützung für neue Arbeitslasten dar. Aber noch spannender ist, dass sie modular konzipiert sind, sodass wir unsere bestehende Infrastruktur für Flüssigkeitskühlung und Energieeffizienz modernisieren können, um generative KI-Anwendungen zu betreiben und unseren CO2-Fußabdruck zu reduzieren.“
Insgesamt, so AWS, werden das neue multimodale Kühlsystem und das verbesserte Stromversorgungssystem es der Organisation ermöglichen, „in den nächsten zwei Jahren eine sechsfache Steigerung der Rack-Leistungsdichte und in der Zukunft eine weitere dreifache Steigerung zu unterstützen“.
In diesem Zusammenhang weist AWS auch darauf hin, dass es jetzt KI nutzt, um vorherzusagen, wie Racks im Rechenzentrum am effizientesten positioniert werden, um die Menge an ungenutztem oder nicht ausreichend genutztem Strom zu reduzieren. AWS wird außerdem ein eigenes Steuerungssystem für seine elektrischen und mechanischen Geräte im Rechenzentrum implementieren, das über integrierte Telemetriedienste für Echtzeitdiagnose und Fehlerbehebung verfügt.
„Rechenzentren müssen sich weiterentwickeln, um den transformativen Anforderungen der KI gerecht zu werden“, sagte Ian Buck, Vizepräsident für Hyperscale und HPC bei NVIDIA. „Durch die Bereitstellung fortschrittlicher Flüssigkeitskühlungslösungen kann die KI-Infrastruktur effizient gekühlt und gleichzeitig der Energieverbrauch minimiert werden. Unsere Zusammenarbeit mit AWS beim Entwurf ihres Flüssigkeitskühlungs-Racks wird es Kunden ermöglichen, anspruchsvolle KI-Workloads mit außergewöhnlicher Leistung und Effizienz auszuführen.“