Hacker legten das größte Archiv des Internets lahm
SAN FRANCISCO. Internet Archive: 31 Millionen Nutzerdaten erbeutet, Attacke offenbart Schwächen.
Das Internet Archive, das es sich zur Aufgabe gemacht hat, die digitale Welt zu archivieren, ist kürzlich Opfer eines Hackerangriffs geworden: Unbekannte haben die Webseite tagelang mit DDoS-Attacken überzogen. Das Archiv und seine "Wayback Machine" waren einige Tage komplett lahmgelegt. Ein eingeschränkter Zugriff ist nun wieder möglich, die Hacker ist das Projekt aber nicht wieder losgeworden, wie diese Woche klar wurde.
Das Internet Archive gibt es seit 1996, seitdem wurden 860 Milliarden Einzelseiten aus dem Netz gespeichert. Auch Bücher und Filme werden erfasst.
Der Cyberangriff wurde von den Tätern selbst im Webarchiv in einem Pop-up-Fenster bekannt gegeben: "Haben Sie nicht auch das Gefühl, dass das Internet Archive auf Stelzen rennt und konstant vor einer katastrophalen Sicherheitspanne steht? Es ist einfach passiert. Sehen Sie 31 Millionen von Ihnen auf HIBP." HIBP steht für "Have I Been Pwned", eine Datenbank, in die man seine E-Mail-Adresse eingeben kann, um zu sehen, ob sie bei einer Cyberattacke abgegriffen wurde. Die Hackergruppe veröffentlichte die Daten von 31 Millionen Nutzern, eine weitere Cyberattacke zwang die Seite in die Knie und machte sie tagelang unzugänglich.
Der Gründer von HIBP, Troy Hunt, bestätigte, dass mehr als 31 Millionen Nutzerdaten abgegriffen wurden. Es handelt sich um eine Datei mit einer Größe von 6,4 Gigabyte. Bei einer DDoS-Attacke geht es darum, eine Webseite unerreichbar zu machen, indem die Server mit zigtausenden Anfragen überlastet werden. Es ist davon auszugehen, dass inmitten dieser DDoS-Welle der tatsächliche Angriff stattfand. Wie genau, ist noch nicht restlos geklärt.
Oft in rechtlicher Grauzone
Inzwischen ist die Wayback Machine wieder online. Allerdings ist der Dienst einstweilen nur in einer reinen Leseversion verfügbar, neue Inhalte werden nicht aufgenommen. Zudem ist es in den vergangenen Tagen erneut zu Vorfällen gekommen, die verdeutlichen, dass die Hacker nach wie vor präsent sind. So haben die unbekannten Angreifer massenhaft Mails an Nutzer der Plattform verschickt, in denen über die technischen Fähigkeiten der Betreiber des Internet Archive gespottet wird. Obwohl die Plattform bereits vor zwei Wochen über die Probleme informiert wurde, habe man es bisher nicht geschafft, bekannte Lücken zu schließen.
Schon in der Vergangenheit gab es Angriffe auf die Seite. Zudem kam es immer wieder zu finanziellen Problemen. Dass die Öffentlichkeit auf das Archiv zugreifen kann, führte in der Vergangenheit zudem des Öfteren zu Urheberrechtsstreitigkeiten. Das Archiv arbeitet oft in einer rechtlichen Grauzone. Unter anderem liegt man im Streit mit Musiklabels, eine Niederlage könnte umgerechnet rund 365 Millionen Euro kosten.
Die jüngsten Angriffe zeigen auch auf, dass das weltgrößte Archiv des digitalen Lebens recht zerbrechlich ist, aber eine ganz zentrale Rolle im Netz spielt. Denn ein Teil des Internets verschwindet täglich und das für immer: Die BBC zitiert eine Studie, wonach ein Viertel der veröffentlichten Einzelseiten zwischen 2013 und 2023 einfach nicht mehr abrufbar ist. Projekte wie das Internet Archive wollen diesem digitalen Vergessen entgegenwirken und speichern Kopien von Internetauftritten. Die Seiten werden automatisiert aufgerufen, archiviert und zeitlich einsortiert. Internet Archive ist ein Non-Profit-Unternehmen, das 1996 von Brewster Kahle gegründet wurde. Er arbeitete damals auch für Alexa, ein Unternehmen, das die Beliebtheit von Webseiten analysierte. Die erste Seite in der "Wayback Machine" datiert vom 10. Mai 1996, seither archivierte das Internet Archive Milliarden verschiedener Seiten zu unterschiedlichen Zeitpunkten.
Wichtig ist dies nicht nur, um einen Eindruck zu bekommen, wie sich das Internet entwickelt hat. Es ist auch eine zeitgeschichtliche Quelle, hält etwa die Berichterstattung zu den Ereignissen vom 11. September 2001 fest. Auch für Wikipedia ist die Seite wesentlich: Um Quellenverweise auch für etwaige gelöschte Seiten zu erhalten, wird in der Regel auf archivierte Seiten aus dem Archiv verwiesen.
Längst sind auch andere Medien im Internet Archive abrufbar, etwa Buchscans, Musik, Video und Videospiele. Praktisch das gesamte Material ist öffentlich zugänglich.
Archive sind teuer
Laut Mark Graham, Direktor der "Wayback Machine", gibt es für Unternehmen wenig Anreize, Daten dauerhaft zu speichern, aber zahlreiche Gefahren, dass diese verloren gehen, etwa wenn Institutionen versagen oder Unternehmen in Konkurs gehen.
Bestrebungen, das Netz zu archivieren, gibt es zwar von einigen Staaten, allerdings meist eingegrenzt, weil damit hohe Kosten verbunden sind. Die USA speichern in erster Linie die Auftritte von Behörden. In Österreich archiviert die Nationalbibliothek Webseiten. Das Internet Archive will möglichst viele Seiten aus der ganzen Welt erhalten und ist dabei auf Spenden und Partnerschaften angewiesen.