Fragen? Antworten! Siehe auch: Alternativlos
seit Ende letzter Woche haben große HPC-Zentren in Deutschland sowie mindestens eines im Ausland (UK) ihre Supercomputer offline genommen. Gefühlt bekomme ich jeden Tag eine neue Beschwerde von Forscherkollegen weil sie plötzlich nicht mehr rechnen können.Da merkt man mal, wieviel Forschung heutzutage Rechenzeit auf Supercomputern braucht.Stuttgart: Maschine wegen "Security Incident" down, http://websrv.hlrs.de/cgi-bin/hwwweather
Archer (UK): http://www.archer.ac.uk/status/
"Due to a security exploitation on the ARCHER login nodes, the decision has been taken to disable access to ARCHER while further investigations take place."Bei Jülich steht nichts auf der Webseite, ist aber down. Barcelona soll es laut Kollegen aus Polen auch getroffen haben.
Ich habe mal rumgefragt und einer aus meiner Arbeitsgruppe der Leute kennt die Leute kennen hat mir folgendes aus Jülich weitergeleitet:
A backdoor was identified on several of our HPC systems.
Da sind wohl sehr viele Leute unruhig, weil: Verbreitungsweg unbekannt. Und sehr, sehr viele Leute können gerade nicht forschen.
Update: Ein Leser vermutet, dass Geheimdienste nach Corona-Impfstoff-Forschungsdaten suchen.
Ein anderer Leser berichtet:
also ich habe diverse Jahre solche Computer gebaut und auch upgraded und gewartet - wodurch ich öfters mal derjenige war, der sie offline genommen hat. Und zwar queerbeet an Unis, RZs, Instituten und auch Firmen in Europa.
... nun, was soll ich sagen. Habe häufig gehört: "ist ganz gut wenn das Ding mal aus ist - dann haben die Leute Zeit nachzudenken was gerechnet wird und warum"
gefolgt von Erklärungen wie:
... in einigen Teams/Lehrstühlen/Häusern gilt als wichtig/produktiv/erfolgreich wessen Name ständig ständig in den Job Queues zu sehen ist.
... einige Teams/Lehrstühle/Häuser verlieren ihr Rechenzeitkontigent auf Computer XYZ, wenn sie es nicht nutzen.
... der Computer / das RZ verliert sein Stromkontigent, wenn er es nicht genutzt wird.
... das Nachfolgesystem wird kleiner wenn die Last unter 100% ist.
Denke Du kannst dir den Irrsinn ausmalen, der sowas bewirkt.
Wieviel Strom auf diese Weise sinnlos verheizt wird und wieviel Rechenkapazität sinnlos installiert wird? ... also die Frage deprimiert genauso wie alle Fragen bezgl. unseres globalen Umweltproblems.
Ist alles "wenig" relativ zu Militär, Automobilen, Flugzeugen, ..., Klimaanlagen, ... und dennoch moralisch kein Stück besser.
Update: Ein anderer Leser fragt, ob das vielleicht mit der Salt-Lücke zu tun hat.
Update: Mehrere Rechenzentren haben intern die Losung ausgegeben, dass man nach setuid-Binaries in /etc/fonts/.fonts und /etc/fonts/.low gucken soll. Ich finde solche Ratschläge immer nicht hilfreich, weil das auf die Payload abhebt, nicht die Lücke. Über die Lücke hätte man auch eine andere Payload ausrollen können. Die Leute sind jetzt alle dabei, wild nach diesen Dateien zu gucken und dann die Systeme neu aufzusetzen. Wenn ihr nicht vorher auch die Lücke zugemacht habt, dann habt ihr dieselben Leute nächste Woche wieder auf den Rechnern.