Jülich: Europas Suche nach dem neuen Super-Computer

Jülich : Europas Suche nach dem neuen Super-Computer

Potenzprotzerei mal anders: 5,9 Billiarden Rechenoperationen pro Sekunden kann Juqueen leisten, der Supercomputer am Forschungszentrum Jülich. Das ist eine Zahl mit 15 Nullen hinten dran, in der Fachsprache heißt das 5,9 Petaflop pro Sekunde.

Damit schafft es Juqueen noch knapp in die Top 20 der leistungsfähigsten Rechner der Welt. Der schnellste steht seit dem vergangenen Jahr in China, heißt Sunway und ist gut 15 Mal so schnell wie Juqueen.

Sie hat von Jülich aus die europaweite Suche nach dem neuen Superrechner koordiniert: Die Physikerin Estala Suárez ist überzeugt, dass das EU-Projekt positive Auswirkungen auf die Zukunft hat. Foto: Guido Jansen

Der Weg mit immer mehr Prozessoren, den die Chinesen mit Sunway gehen, führt nicht in die Zukunft der Supercomputer. Da ist sich Estela Suárez ziemlich sicher. Die Spanierin hat einen Doktortitel in Physik und betreut das sogenannte Deep-er-Projekt am Forschungszentrum Jülich. Sie gehört damit zu einem Zusammenschluss von Forschern aus Europa, die in den vergangenen vier Jahren ein Ziel verfolgt haben: eine Rechnerleistung mit 18 Nullen. Jetzt endet das Projekt, gerade verfassen Experten der Europäische Union ihren Abschlussbericht. Dann zeigt sich, ob der Weg von Deep-er mit Nachfolgeprojekten weiter gegangen wird. „Ich weiß, dass wir gute Ergebnisse erzielt haben und dass wir die Gutachter davon überzeugen können“, sagte Suárez vor dem Besuch der Experten-Kommission. „Aber trotzdem ist das wie vor den Abitur-Prüfungen: Angespannt ist man trotzdem.“

Das Ziel, zu dem Deep-er Beiträge liefern soll: Spätestens 2025 soll in Europa ein Rechner stehen, dessen Leistung in Exaflops angegeben wird. Zum Vergleich: Ein moderner Privatcomputer rechnet im Gigaflop-Bereich, das ist eine Zahl mit neun oder in der ganz großen Version zehn Nullen hinten dran. Juqueen und die anderen Superrechner sind mit 15 Nullen (Petaflop) unterwegs, Ziel bis 2025 sind 18 (Exaflop). So hat es EU-Kommissar Günter Oettinger im vergangenen Jahr formuliert. Damit würde Europa ganz nach vorne springen in der Rangliste der schnellsten Rechner. Allerdings tickt die Uhr. Die Chinesen haben einen Exaflop-Rechner für 2020 angekündigt, die USA wollen nachziehen. Das erhöht den Druck.

Ein Flugzeug simulieren

„Die Rangliste ist aber gar nicht das Ziel“, sagt Estela Suárez. „Wir brauchen deswegen immer leistungsfähigere Computer, weil wir immer komplexere wissenschaftliche Probleme erforschen wollen.“ Simulatoren gebe es viele, die dabei helfen, Flugzeugflügel oder einzelne Bauteile zu entwickeln. Einen komplett simulierten Flug mit allen Faktoren allerdings nicht. „Ein gesamtes Flugzeug auf einmal sehr präzise zu simulieren — das geht auch mit einem heutigen Supercomputer kaum“, erklärt Suárez. Die Berechnung würde ein halbes Jahr dauern. Ungefähr. Die heutigen Supercomputer haben aber immerhin den Weg gezeigt, dass ein Exaflop-Rechner solche Simulationen berechnen könnte. Deswegen ist Exaflop das Ziel. Unter anderem.

Einen anderen Weg als den der Chinesen, Exaflop zu erreichen, beschreiten Estela Suárez und die anderen Deep-er-Forscher. Eines steht für sie alle fest: Um Exaflop zu erreichen, braucht es neue Konzepte. „Die Architektur der heutigen Supercomputer ist so gut wie ausgereizt“, sagt Estela Suárez. Sie alle sind sogenannte Cluster-Rechner, die darauf ausgelegt sind, so viele Rechenoperationen wie möglich gleichzeitig zu erledigen.

Drei Tennisplätze groß

Sunway, der Weltranglistenerste aus China, ist aus Sicht von Suárez und ihren Kollegen der Versuch, mit schierer Größe und ohne neue Konzepte den Spitzenplatz zu belegen. Die Installation von Juqueen nimmt etwa den Raum eines Tennisplatzes ein. Sunway ist mehr als dreimal so groß. Juequeen hat knapp 460 000 Prozessorkerne, bei Sunway sind es über 10,6 Millionen. Ein normaler PC liegt bei vier oder acht. Folgen der großen Zahl an Prozessorkernen, die einher geht mit einer vergleichsweise begrenzten Speicherkapazität seien laut Suárez eine erschwerte Programmierbarkeit und ein sehr hoher Energieverbrauch.

Die Regeln der Europäische Union zur Förderung von Supercomputerprojekten sorgen dafür, dass ihre Forscher neue Wege gehen müssen und nicht darüber nachdenken, Exaflop zu erreichen, indem sie den Rechner einfach immer größer bauen: Der Exaflop-Rechner darf nicht so viel Strom verbrauchen, dass man direkt daneben ein Kraftwerk bauen müsste, um ihn zu versorgen. Juqueen braucht pro Stunde so viel Strom wie ein Zwei-Personen-Haushalt im Jahr, Sunway saugt in 60 Minuten mehr Strom als fünf Familien im Jahr. Das ist im Verhältnis zur Rechnerleitung viel besser als alle anderen heutigen Superrechner. In die Zukunft führe dieser Weg laut Suárez trotzdem nicht. Unter Volllast zieht Sunway 15,37 Megawatt.

Zwei Philosophien

Würde man den chinesischen Weltranglistenersten zehnmal so groß bauen wie jetzt, dann stünde er kurz vor dem Ziel Exaflop, sein jährlicher Stromverbrauch entspräche mit 153,7 Megawatt dem von 440 000 Familien. Im Kraftwerk Weisweiler müssten pro Jahr knapp 200 000 Tonnen Braunkohle verfeuert werden, um einen Exaflop-Rechner mit dieser Architektur zu füttern.

Das europäische Ziel ist klar vorgegeben: Es wird der schnellste Rechner gesucht, der nicht mehr als 20 Megawatt verbraucht. Deswegen suchen sie in Europa nicht den schnellsten Rechner um jeden Preis, sondern den mit dem besten Verhältnis von Leistung und Verbrauch. „Beide Ziele — also Exaflop und ein sehr energiesparender Supercomputer — werden einzeln wahrscheinlich früher als 2025 erreicht. Die Frage ist, wann es gelingt, beides auf einmal zu schaffen“, sagt Suárez.

Mit Deep-er haben Estela Suárez und ihre Kollegen die Idee verfolgt, zwei Computerarchitektur-Philosophien miteinander zu verschmelzen. Beide Philosophien gibt es schon am Jülich Supercomputing Center. Das Flagschiff Juqueen ist der Rechner, der sehr viele vergleichsweise einfache Operationen parallel rechnen kann. Deswegen auch die 460 000 Prozessorkerne. „Die Prozessoren, die in Juqueen zum Einsatz kommen, sind für einen Hochleistungsrechner nichts Außergewöhnliches. Es sind einfach sehr viele“, beschreibt Suárez.

Booster heißt das Konzept, dass die Deep-er-Forscher aus Juqueen heraus entwickelt haben. Neben Juqueen steht Jureca, das krasse Computer-Philosophie-Gegenteil. Jureca hat weniger Prozessoren, dafür sind die Prozessoren das Schnellste, was die Technologie hergibt. Die Wissenschaftler sprechen von einem Cluster-Rechner, der dazu genutzt wird, weniger Rechenoperationen parallel auszuführen, die dafür allerdings komplexer sind. Bei Deep-er soll am Ende ein Cluster-Booster-Rechner herauskommen, der das Beste aus beiden Philosophien kombiniert. „Ich vergleiche das mit dem Bau eines Hauses. Ich kann das Haus nur von hoch ausgebildeten Facharbeitern mit viel Berufserfahrung bauen lassen. Dann wird das Haus am Ende sehr teuer. Ich kann die vielen einfachen Handgriffe aber auch von weniger teuren, jüngeren Arbeitern erledigen lassen, während die Erfahrenen für die schwierigen Dinge zuständig sind“, sagt Suárez.

Diese Kombination aus Vielen, die viele einfache Aufgaben gleichzeitig erledigen, und Wenigen, die für komplizierte Fälle zuständig sind — das soll der Cluster-Booster-Rechner sein.

Wichtig: die Software

Das Ergebnis, dass Suárez in dieser Woche präsentieren kann: Das Cluster-Booster-Konzept funktioniert. Und es ist beherrschbar. Bei Deep-er sei es nicht nur um die Hardware des Cluster-Booster-Konzeptes gegangen. „Wir haben lange an einer Software gearbeitet, mit der es möglich ist, die Rechenaufgaben so zu verteilen, dass der Cluster die komplexen Aufgaben übernimmt und der Booster die, bei denen viele Operationen zeitgleich gerechnet werden müssen. Das Resultat ist ein funktionierendes Rechnerkonzept, dass es so in der Art kein zweites Mal gibt.“

Mehr von Aachener Nachrichten