Noch nie in der Geschichte der Menschheit gab es so viele Informationen darüber Erkundung der Wayback Machine im Jahr 2023: Ein umfassender Leitfaden wie heute dank des Internets. Allerdings ist dieser Zugriff auf alles im Zusammenhang Erkundung der Wayback Machine im Jahr 2023: Ein umfassender Leitfaden ist nicht immer einfach. Sättigung, schlechte Benutzerfreundlichkeit und die Schwierigkeit, zwischen richtigen und falschen Informationen zu unterscheiden Erkundung der Wayback Machine im Jahr 2023: Ein umfassender Leitfaden sind oft schwer zu überwinden. Das hat uns motiviert, eine zuverlässige, sichere und effektive Website zu erstellen.
Uns war klar, dass es zur Erreichung unseres Ziels nicht ausreicht, über korrekte und verifizierte Informationen zu verfügen Erkundung der Wayback Machine im Jahr 2023: Ein umfassender Leitfaden . Alles, was wir darüber gesammelt hatten Erkundung der Wayback Machine im Jahr 2023: Ein umfassender Leitfaden musste auch auf klare, lesbare Weise präsentiert werden, in einer Struktur, die die Benutzererfahrung erleichtert, mit einem sauberen und effizienten Design, und die Ladegeschwindigkeit priorisiert. Wir sind zuversichtlich, dass uns dies gelungen ist, auch wenn wir stets an kleinen Verbesserungen arbeiten. Wenn Sie gefunden haben, was Sie nützlich fanden Erkundung der Wayback Machine im Jahr 2023: Ein umfassender Leitfaden und Sie sich wohlgefühlt haben, wir würden uns sehr freuen, wenn Sie wiederkommen scientiaen.com wann immer Sie wollen und müssen.
![]() | |
Art der Website | Archiv |
---|---|
Gründung |
|
Bereich serviert | Weltweit (außer China und Bahrain) |
Eigentümer | Internet Archive |
URL | Netz |
Gewerbe | Nein |
Registrierung | Optional |
Aktueller Status | Aktives |
Geschrieben in | HTML, CSS, JavaScript, Java, Python. |
Das Wayback Machine ist eine digitale Archiv dauert ebenfalls 3 Jahre. Das erste Jahr ist das sog. World Wide Web gegründet von der Internet Archive, eine gemeinnützige Organisation mit Sitz in San Francisco, Kalifornien. Es wurde 1996 erstellt und 2001 der Öffentlichkeit vorgestellt und ermöglicht es dem Benutzer, "in der Zeit zurück zu gehen" und zu sehen, wie Websites in der Vergangenheit aussahen. Seine Gründer, Braumeister Kahle und Bruce Gilliat, entwickelte die Wayback Machine, um „universellen Zugang zu allem Wissen“ zu bieten, indem archivierte Kopien nicht mehr existierender Webseiten aufbewahrt werden.
Die am 10. Mai 1996 gestartete Wayback Machine hatte Ende 38.2 mehr als 2009 Millionen Webseiten gespeichert. Stand: 13. März 2023, hat die Wayback Machine mehr als 800 Milliarden Webseiten archiviert.
Die Wayback Machine begann mit der Archivierung zwischengespeichert Webseiten im Jahr 1996. Eine der frühesten bekannten Seiten wurde am 10. Mai 1996 unter archiviert (UTC).
Internet Archive Gründer Braumeister Kahle und Bruce Gilliat startete die Wayback Machine in San Francisco, Kalifornien , im Oktober 2001 in erster Linie, um das Problem zu lösen, dass Webinhalte verschwinden, wenn sie geändert werden oder wenn eine Website heruntergefahren wird. Der Dienst ermöglicht es Benutzern, archivierte Versionen von anzuzeigen Web-Seiten über die Zeit, die das Archiv einen "dreidimensionalen Index" nennt. Kahle und Gilliat erschufen die Maschine in der Hoffnung, das gesamte Internet zu archivieren und "universellen Zugang zu allem Wissen" zu bieten. Der Name „Wayback Machine“ ist eine Anspielung auf ein fiktives Zeitreise- und Übersetzungsgerät, das „Wayback Machine", verwendet von den Charakteren Herr Peabody und Sherman im Zeichentrickfilm Die Abenteuer von Rocky und Bullwinkle and Friends. In einem der Segmente des Cartoons, "Peabody's Improbable History", benutzten die Charaktere die Maschine, um berühmte Ereignisse in der Geschichte mitzuerleben, daran teilzunehmen und sie oft zu verändern.
Von 1996 bis 2001 wurden die Informationen auf digitalem Band aufbewahrt, wobei Kahle gelegentlich Forschern und Wissenschaftlern erlaubte, die "klobigen" Datenbank. Als das Archiv im Jahr 2001 sein fünfjähriges Bestehen feierte, wurde es enthüllt und in einer Feierstunde der Öffentlichkeit zugänglich gemacht University of California, Berkeley. Als die Wayback Machine auf den Markt kam, enthielt sie bereits über 10 Milliarden archivierte Seiten. Die Daten werden auf dem großen Cluster des Internetarchivs gespeichert Linux Knoten. Es besucht und archiviert gelegentlich neue Versionen von Websites (siehe technische Details unten). Websites können auch manuell erfasst werden, indem Sie eine Website eingeben URL in das Suchfeld ein, vorausgesetzt, die Website erlaubt der Wayback-Maschine, sie zu "crawlen" und die Daten zu speichern.
Am 30. Oktober 2020 begann die Wayback Machine mit der Überprüfung von Inhalten. Ab Januar 2022 sind Domains von Ad-Server sind für die Aufnahme gesperrt.
Im Mai 2021, zum 25-jährigen Jubiläum von Internet Archive, stellte die Wayback Machine die „Wayforward Machine“ vor, die es Benutzern ermöglicht, „im Jahr 2046 ins Internet zu reisen, wo das Wissen untergeht Belagerung".
Die Software der Wayback Machine wurde entwickelt, um "kriechen" das Web und laden Sie alle öffentlich zugänglichen Informationen und Dateien auf Webseiten herunter, die Ziesel Hierarchie, die Netznachrichten (Usenet) Bulletin-Board-System und herunterladbare Software. Die von diesen "Crawlern" gesammelten Informationen umfassen nicht alle im Internet verfügbaren Informationen, da viele der Daten vom Herausgeber eingeschränkt oder in nicht zugänglichen Datenbanken gespeichert sind. Um Inkonsistenzen in teilweise zwischengespeicherten Websites zu überwinden, wurde Archive-It.org 2005 vom Internet Archive entwickelt, um es Institutionen und Erstellern von Inhalten zu ermöglichen, freiwillig Sammlungen digitaler Inhalte zu sammeln und zu bewahren und digitale Archive zu erstellen.
Crawls werden aus verschiedenen Quellen beigesteuert, einige von Dritten importiert und andere intern vom Archiv generiert. Zum Beispiel werden Crawls von den beigetragen Sloan-Stiftung und Alexa, Crawls, die von Internet Archive im Auftrag von ausgeführt werden NARA und dem Internet-Memory-Stiftung, Spiegel von Allgemeines Crawlen. Die „Worldwide Web Crawls“ laufen seit 2010 und erfassen das globale Web.
Dokumente und Ressourcen werden mit Zeitstempel-URLs wie gespeichert 20230604141935
. Die einzelnen Ressourcen der Seiten wie Bilder und Stylesheets und Skripte sowie ausgehende Hyperlinks werden mit dem Zeitstempel der aktuell angezeigten Seite verknüpft, sodass sie automatisch zu ihren individuellen Erfassungen weitergeleitet werden, die zeitlich am nächsten liegen.
Die Häufigkeit von Snapshot-Erfassungen variiert je nach Website. Websites in den "Worldwide Web Crawls" werden in eine "Crawl-Liste" aufgenommen, wobei die Website einmal pro Crawl archiviert wird. Ein Crawl kann je nach Größe Monate oder sogar Jahre dauern. Beispiel: „Wide Crawl Number 13“ begann am 9. Januar 2015 und wurde am 11. Juli 2016 abgeschlossen. Es können jedoch mehrere Crawls gleichzeitig ausgeführt werden und eine Website kann in mehr als einer Crawling-Liste enthalten sein, sodass die Häufigkeit, mit der eine Website gecrawlt wird, sehr unterschiedlich ist.
Ab Oktober 2019 sind die Benutzer begrenzt bis zu 15 Archivierungsanfragen und -abrufe pro Minute.[Wieso den?]
Da sich die Technologie im Laufe der Jahre weiterentwickelt hat, ist die Speicherkapazität der Wayback-Maschine gewachsen. Im Jahr 2003, nach nur zwei Jahren öffentlicher Zugänglichkeit, wuchs die Wayback Machine mit einer Rate von 12 Terabyte pro Monat. Die Daten werden auf gespeichert PetaBox Rack-Systeme, die von Internet Archive-Mitarbeitern individuell entworfen wurden. Das erste 100-TB-Rack wurde im Juni 2004 vollständig in Betrieb genommen, obwohl bald klar wurde, dass sie viel mehr Speicherplatz benötigen würden.
Das Internetarchiv hat seine angepasste Speicherarchitektur auf migriert Sun Open Storage im Jahr 2009 und beherbergt ein neues Rechenzentrum in a Modulares Rechenzentrum von Sun on Sun Microsystems'Kalifornischer Campus. Ab 2009, die Wayback-Maschine enthielt ungefähr drei Petabyte von Daten und wuchs mit einer Rate von 100 Terabytes jeden Monat.
Eine neue, verbesserte Version der Wayback Machine mit einer aktualisierten Benutzeroberfläche und einem frischeren Index archivierter Inhalte wurde 2011 für öffentliche Tests zur Verfügung gestellt, bei der Aufnahmen in einem Kalenderlayout mit Kreisen angezeigt werden, deren Breite die Anzahl der täglichen Crawls visualisiert. aber keine Markierung von Duplikaten mit Sternchen oder eine erweiterte Suchseite. Ein Top Symbolleiste wurde hinzugefügt, um das Navigieren zwischen Aufnahmen zu erleichtern. Ein Balkendiagramm visualisiert die Häufigkeit der Erfassungen pro Monat über die Jahre. Features wie „Änderungen“, „Zusammenfassung“ und eine grafische Sitemap wurden nachträglich hinzugefügt.
Im März dieses Jahres hieß es im Wayback Machine-Forum, dass „die Beta der neuen Wayback Machine einen vollständigeren und aktuelleren Index aller gecrawlten Materialien bis 2010 hat und weiterhin regelmäßig aktualisiert wird. Der Index Das Fahren der klassischen Wayback Machine hat nur wenig Material nach 2008, und es sind keine weiteren Index-Updates geplant, da es dieses Jahr auslaufen wird." Ebenfalls im Jahr 2011 installierte das Internetarchiv sein sechstes Paar PetaBox-Racks, wodurch die Speicherkapazität der Wayback-Maschine um 700 Terabyte erhöht wurde.
Im Januar 2013 gab das Unternehmen einen bahnbrechenden Meilenstein von 240 Milliarden URLs bekannt.
Im Oktober 2013 führte das Unternehmen die Funktion „Seite speichern“ ein die es jedem Internetbenutzer ermöglicht, den Inhalt einer URL zu archivieren, und schnell eine generiert permanenter Link im Gegensatz zu den vorangegangenen Liveweb -Funktion erstellt werden.
Im Dezember 2014 enthielt die Wayback Machine 435 Billion Webseiten – fast neun Petabyte an Daten und wuchs um etwa 20 Terabyte pro Woche.
Im März 2015 wurde veröffentlicht, dass Sicherheitsforscher auf die Bedrohung durch den Dienst aufmerksam wurden Hosting bösartiger Binärdateien von archivierten Seiten.
Im Juli 2016 enthielt die Wayback Machine angeblich rund 15 Petabyte an Daten.
Im September 2018 enthielt die Wayback Machine über 25 Petabyte an Daten.
Ab Dezember 2020 enthielt die Wayback Machine über 70 Petabyte an Daten.
Der Wayback Machine-Dienst bietet drei öffentliche APIs, SavePageNow, Availability und CDX. SavePageNow kann zum Archivieren von Webseiten verwendet werden. Verfügbarkeits-API zum Überprüfen des Archivverfügbarkeitsstatus für eine Webseite, Überprüfen, ob ein Archiv für die Webseite existiert oder nicht. Die CDX-API dient zum komplexen Abfragen, Filtern und Analysieren erfasster Daten.
Historisch gesehen hat die Wayback Machine das respektiert Ausschlussstandard für Roboter (robots.txt) bei der Bestimmung, ob eine Website gecrawlt werden würde – oder, falls bereits gecrawlt, ob ihre Archive öffentlich einsehbar wären. Websitebesitzer hatten die Möglichkeit, Wayback Machine durch die Verwendung von robots.txt abzulehnen. Es wendete die robots.txt-Regeln rückwirkend an; Wenn eine Website das Internetarchiv blockierte, wurden auch alle zuvor archivierten Seiten der Domain sofort nicht mehr verfügbar. Darüber hinaus erklärte das Internet Archive: „Manchmal kontaktiert uns ein Website-Eigentümer direkt und bittet uns, das Crawlen oder Archivieren einer Website einzustellen. Wir kommen diesen Anfragen nach.“ Außerdem heißt es auf der Website: „Das Internetarchiv ist nicht daran interessiert, Websites oder andere Internetdokumente von Personen zu erhalten oder zugänglich zu machen, die ihre Materialien nicht in der Sammlung haben wollen.“
Am 17. April 2017 tauchten Berichte über Websites auf, die nicht mehr funktionierten und wurden geparkte Domains die robots.txt verwendet haben, um sich von Suchmaschinen auszuschließen, was dazu führte, dass sie versehentlich von der Wayback-Maschine ausgeschlossen wurden. Das Internetarchiv hat die Richtlinie dahingehend geändert, dass jetzt eine explizite Ausschlussanforderung erforderlich ist, um sie von der Wayback-Maschine zu entfernen.
Die Richtlinie zum rückwirkenden Ausschluss von Wayback basiert teilweise auf Empfehlungen für die Verwaltung von Entfernungsanforderungen und die Wahrung der Archivintegrität herausgegeben von der School of Information Management and Systems at University of California, Berkeley im Jahr 2002, die einem Website-Eigentümer das Recht gibt, den Zugriff auf die Archive der Website zu sperren. Wayback hat sich an diese Richtlinie gehalten, um teure Rechtsstreitigkeiten zu vermeiden.
Die rückwirkende Ausschlussrichtlinie von Wayback begann sich 2017 zu lockern, als sie aufhörte, Roboter auf Websites der US-Regierung und des Militärs sowohl für das Crawlen als auch für das Anzeigen von Webseiten zu ehren. Seit April 2017 ignoriert Wayback die robots.txt im weiteren Sinne, nicht nur für Websites der US-Regierung.
Seit ihrer öffentlichen Einführung im Jahr 2001 wurde die Wayback Machine von Wissenschaftlern sowohl hinsichtlich der Art und Weise, wie sie Daten speichert und sammelt, als auch hinsichtlich der tatsächlichen Seiten, die in ihrem Archiv enthalten sind, untersucht. Bis 2013 hatten Wissenschaftler etwa 350 Artikel über die Wayback-Maschine geschrieben, hauptsächlich aus den Bereichen Informationstechnologie, Bibliothekswissenschaft und Sozialwissenschaften. Sozialwissenschaftler haben mit der Wayback Machine analysiert, wie sich die Entwicklung von Websites von Mitte der 1990er Jahre bis heute auf das Wachstum des Unternehmens ausgewirkt hat.
Wenn die Wayback-Maschine eine Seite archiviert, enthält sie normalerweise die meisten Hyperlinks und hält diese Links aktiv, wenn sie genauso leicht durch die Instabilität des Internets hätten beschädigt werden können. Forscher in Indien untersuchten die Effektivität der Fähigkeit der Wayback-Maschine, Hyperlinks in wissenschaftlichen Online-Veröffentlichungen zu speichern, und stellten fest, dass etwas mehr als die Hälfte davon gespeichert wurden.
„Journalisten verwenden die Wayback Machine, um tote Websites, datierte Nachrichtenberichte und Änderungen an Website-Inhalten anzuzeigen. Ihr Inhalt wurde verwendet, um Politiker zur Rechenschaft zu ziehen und Lügen auf dem Schlachtfeld aufzudecken.“ Im Jahr 2014 wurde eine archivierte Social-Media-Seite von Igor Girkin, ein separatistischer Rebellenführer in der Ukraine, zeigte ihn, wie er damit prahlte, dass seine Truppen ein mutmaßliches ukrainisches Militärflugzeug abgeschossen hatten, bevor bekannt wurde, dass es sich bei dem Flugzeug tatsächlich um einen zivilen Jet der Malaysian Airlines handelte (Malaysia Airlines Flug 17), woraufhin er den Post löschte und das ukrainische Militär für den Abschuss des Flugzeugs verantwortlich machte. In 2017 stellte das Marsch für die Wissenschaft entstand aus einer Diskussion über reddit das deutete darauf hin, dass jemand Archive.org besucht und festgestellt hatte, dass alle Verweise auf Klimawechsel war von der Website des Weißen Hauses gelöscht worden. Als Antwort kommentierte ein Benutzer: „Es muss einen Wissenschaftlermarsch auf Washington geben“.
Darüber hinaus wird die Website stark zur Überprüfung verwendet, um Zugriff auf Referenzen und die Erstellung von Inhalten zu ermöglichen Wikipedia-Redakteure.
Im September 2020 wurde eine Partnerschaft mit bekannt gegeben Cloudflare Websites, die über seinen "Always Online"-Dienst bereitgestellt werden, automatisch zu archivieren, was es ihm auch ermöglicht, Benutzer zu seiner Kopie der Website zu leiten, wenn der ursprüngliche Host nicht erreicht werden kann.
Im Jahr 2014 gab es eine Verzögerung von sechs Monaten zwischen dem Crawlen einer Website und dem Zeitpunkt, an dem sie für die Anzeige in der Wayback-Maschine verfügbar wurde. Derzeit beträgt die Verzögerungszeit 3 bis 10 Stunden. Die Wayback Machine bietet nur eingeschränkte Suchmöglichkeiten. Seine "Site Search"-Funktion ermöglicht es Benutzern, eine Site anhand von Wörtern zu finden, die die Site beschreiben, und nicht anhand von Wörtern, die auf den Webseiten selbst gefunden werden.
Die Wayback Machine enthält aufgrund der Einschränkungen ihres Web-Crawlers nicht jede Webseite, die jemals erstellt wurde. Die Wayback Machine kann Webseiten, die interaktive Funktionen wie Flash-Plattformen und in JavaScript geschriebene Formulare enthalten, nicht vollständig archivieren und progressive Webanwendungen, da diese Funktionen eine Interaktion mit der Host-Website erfordern. Dies bedeutet, dass die Wayback Machine seit etwa dem 9. Juli 2013 keine YouTube-Kommentare mehr anzeigen kann, wenn die Wiedergabeseiten von Videos gespeichert werden, da Kommentare laut Archivteam nicht mehr „innerhalb der Seite selbst geladen“ werden. Der Web-Crawler von Wayback Machine hat Schwierigkeiten, alles zu extrahieren, was nicht in HTML oder einer seiner Varianten codiert ist, was oft zu fehlerhaften Hyperlinks und fehlenden Bildern führen kann. Aus diesem Grund kann der Webcrawler keine „verwaisten Seiten“ archivieren, auf die keine anderen Seiten verlinken. Der Crawler der Wayback Machine folgt nur einer vorgegebenen Anzahl von Hyperlinks basierend auf einer voreingestellten Tiefenbegrenzung, sodass er nicht jeden Hyperlink auf jeder Seite archivieren kann.
In einem Fall aus dem Jahr 2009 Netbula, LLC gegen Chordiant Software Inc., reichte der Angeklagte Chordiant einen Antrag ein, um Netbula zu zwingen, das zu deaktivieren robots.txt Datei auf seiner Website, die dazu führte, dass die Wayback Machine rückwirkend den Zugriff auf frühere Versionen von Seiten entfernte, die sie von Netbulas Website archiviert hatte, Seiten, von denen Chordiant glaubte, dass sie ihren Fall unterstützen würden.
Netbula lehnte den Antrag mit der Begründung ab, dass die Beklagten darum baten, die Website von Netbula zu ändern, und dass sie das Internetarchiv direkt für die Seiten hätten vorladen sollen. Ein Mitarbeiter von Internet Archive reichte eine eidesstattliche Erklärung ein, in der er den Antrag von Chordiant unterstützte, in der er jedoch erklärte, dass er die Webseiten auf keine andere Weise „ohne erheblichen Aufwand, Kosten und Unterbrechung seines Betriebs“ erstellen könne.
Magistrate Judge Howard Lloyd im Northern District of California, San Jose Division, wies Netbulas Argumente zurück und wies sie an, die robots.txt-Blockierung vorübergehend zu deaktivieren, damit Chordiant die gesuchten archivierten Seiten abrufen kann.
In einem Fall vom Oktober 2004 Telewizja Polska USA, Inc. v. Echostar-Satellit, Nr. 02 C 3293, 65 Föderal. R. Evid. Dienst 673 (ND Ill. 15. Oktober 2004) versuchte ein Prozesspartei, vielleicht zum ersten Mal, die Archive der Wayback Machine als Quelle für zulässige Beweise zu verwenden. Telewizja Polska ist der Anbieter von TVP Polen und EchoStar betreibt die Dish Network. Vor dem Gerichtsverfahren gab EchoStar an, Wayback Machine-Snapshots als Beweis für den früheren Inhalt der Website von Telewizja Polska anbieten zu wollen. Telewizja Polska hat einen Antrag gestellt am Anfang die Schnappschüsse auf Grund zu unterdrücken Hörensagen und nicht authentifizierter Quelle, aber Richter Arlander Keys wies die Behauptung von Telewizja Polska vom Hörensagen zurück und wies den Antrag von TVP zurück am Anfang die Beweise im Prozess auszuschließen. Bei der Verhandlung setzte jedoch der Richter am Bezirksgericht, Ronald Guzman, die Feststellungen von Magistrate Keys außer Kraft und entschied, dass weder die eidesstattliche Erklärung des Mitarbeiters des Internetarchivs noch die zugrunde liegenden Seiten (dh die Website von Telewizja Polska) als Beweismittel zulässig seien. Richter Guzman begründete dies damit, dass die eidesstattliche Erklärung des Angestellten sowohl Hörensagen als auch nicht schlüssige unterstützende Aussagen enthielt und dass die angeblichen Ausdrucke der Webseite nicht selbstbeglaubigend seien.
Das Patentamt der Vereinigten Staaten und dem European Patent Office akzeptiert Datumsstempel aus dem Internetarchiv als Beweis dafür, wann eine bestimmte Webseite öffentlich zugänglich war. Diese Daten werden verwendet, um festzustellen, ob eine Webseite als verfügbar ist Stand der Technik beispielsweise bei der Prüfung einer Patentanmeldung.
Es gibt technische Einschränkungen bei der Archivierung einer Website, und folglich können gegnerische Parteien in Rechtsstreitigkeiten die Ergebnisse, die von Website-Archiven bereitgestellt werden, missbrauchen. Dieses Problem kann durch die Praxis verschärft werden, Screenshots von Webseiten in Beschwerden, Antworten oder Sachverständigengutachten einzureichen, wenn die zugrunde liegenden Links nicht offengelegt werden und daher Fehler enthalten können. Beispielsweise füllen Archive wie die Wayback Machine keine Formulare aus und enthalten daher keine Inhalte von Nicht-RESTful E-Commerce-Datenbanken in ihren Archiven.
In Europa könnte die Wayback Machine als Verletzung interpretiert werden Urheberrecht Gesetze. Nur der Inhaltsersteller kann entscheiden, wo seine Inhalte veröffentlicht oder vervielfältigt werden, sodass das Archiv auf Anfrage des Erstellers Seiten aus seinem System löschen müsste. Die Ausschlussrichtlinien für die Wayback-Maschine finden Sie im FAQ-Bereich der Website.
Einige Fälle wurden gegen das Internetarchiv speziell wegen seiner Bemühungen zur Archivierung von Wayback Machine angestrengt.
Ende 2002 entfernte das Internetarchiv verschiedene Seiten, die kritisch geäußert wurden Scientology von der Wayback-Machine. Eine Fehlermeldung besagte, dass dies auf eine "Anfrage des Website-Eigentümers" geantwortet habe. Später wurde klargestellt, dass Anwälte aus der Scientology Kirche die Entfernung gefordert hatten und dass die Seitenbesitzer nicht wollten, dass ihr Material entfernt wurde.
Im Jahr 2003 verteidigte Harding Earley Follmer & Frailey einen Mandanten vor einem Markenstreit mit der Wayback Machine des Archivs. Die Rechtsanwälte konnten anhand der Inhalte ihrer mehrere Jahre zurückliegenden Website nachweisen, dass die von der Klägerin geltend gemachten Ansprüche nichtig waren. Der Kläger, Healthcare Advocates, änderte dann seine Beschwerde, um das Internetarchiv einzubeziehen, und beschuldigte die Organisation der Urheberrechtsverletzung sowie der Verletzungen des DMCA und dem Computer-Betrugs- und Missbrauchsgesetz. Healthcare Advocates behaupteten, dass, da sie a installiert hatten robots.txt Datei auf ihrer Website, selbst wenn das Archiv nach Einreichung der ursprünglichen Klage alle vorherigen Kopien der Website des Klägers von der Wayback-Maschine hätte entfernen sollen, einiges Material jedoch weiterhin öffentlich auf Wayback sichtbar war. Die Klage wurde außergerichtlich beigelegt, nachdem Wayback das Problem behoben hatte.
Aktivist Susanne Shell reichte im Dezember 2005 Klage ein und forderte Internet Archive auf, ihr 100,000 US-Dollar für die Archivierung ihrer Website profane-justice.org zwischen 1999 und 2004 zu zahlen. Internetarchiv abgelegt a Feststellungsurteil Aktion in der Bezirksgericht der Vereinigten Staaten für den nördlichen Bezirk von Kalifornien am 20. Januar 2006, um eine gerichtliche Feststellung zu erreichen, dass Internet Archive Shells nicht verletzt hat Urheberrecht. Shell antwortete und brachte a Gegenanzug gegen Internet Archive für die Archivierung ihrer Website, die ihrer Meinung nach gegen sie verstößt Nutzungsbedingungen. Am 13. Februar 2007 wurde ein Richter für die Bezirksgericht der Vereinigten Staaten für den Bezirk Colorado wies alle Widerklagen außer Vertragsbruch. Das Internetarchiv bewegte sich nicht, um zu entlassen Urheberrechtsverletzung Ansprüche, die Shell aus seinen Kopieraktivitäten geltend macht, die auch in die Zukunft gehen würden.
Am 25. April 2007 gaben Internet Archive und Suzanne Shell gemeinsam die Beilegung ihrer Klage bekannt. Das Internetarchiv sagte, es habe „kein Interesse daran, Materialien von Personen in die Wayback-Maschine aufzunehmen, die ihre Webinhalte nicht archivieren möchten. Wir erkennen an, dass Ms. Shell ein gültiges und durchsetzbares Urheberrecht an ihrer Website und an uns hat bedauern, dass die Aufnahme ihrer Website in die Wayback Machine zu diesem Rechtsstreit geführt hat." Shell sagte: „Ich respektiere den historischen Wert des Ziels von Internet Archive. Ich hatte nie die Absicht, dieses Ziel zu stören oder ihm Schaden zuzufügen.“
Zwischen 2013 und 2016, a pornografischer Schauspieler namens Daniel Davydiuk versuchte, archivierte Bilder von sich selbst aus dem Archiv der Wayback Machine zu entfernen, indem er zunächst mehrere schickte DMCA-Anfragen an das Archiv und dann durch Berufung an die Bundesgericht von Kanada. 2017 wurden die Bilder dann endgültig von der Website entfernt.
Im Jahr 2018, Archiv von Stalkerware-Anwendung FlexiSpyDie Website von wurde von der Wayback Machine entfernt. Das Unternehmen behauptete, das Internetarchiv kontaktiert zu haben, vermutlich um die Archive seiner Website zu entfernen.
Archive.org ist derzeit in China blockiert. Nachdem die Terrororganisation Islamischer Staat verboten worden war, war das Internetarchiv gesperrt worden in Russland vollständig gesperrt 2015–16 für kurze Zeit als Moderator eines Outreach-Videos dieser Organisation.[muss aktualisiert werden] Seit 2016 ist die Website wieder vollständig verfügbar, obwohl lokale Wirtschaftslobbyisten das Internet Archive vor einem lokalen Gericht auf urheberrechtliches Verbot verklagen.
Alison Macrina, Direktor der Bibliotheksfreiheitsprojekt, stellt fest, dass „Bibliothekare die Privatsphäre des Einzelnen sehr schätzen, wir uns aber auch entschieden gegen Zensur wehren“.
Es gibt mindestens einen Fall, in dem ein Artikel aus dem Archiv entfernt wurde, kurz nachdem er von seiner ursprünglichen Website entfernt worden war. A Daily Beast Reporter hatte 2016 einen Artikel geschrieben, in dem mehrere schwule Olympioniken geoutet wurden, nachdem er in einer Dating-App ein gefälschtes Profil erstellt hatte, in dem er sich als schwuler Mann ausgab. The Daily Beast entfernte den Artikel, nachdem er auf breites Aufsehen gestoßen war; Nicht lange danach tat es auch das Internetarchiv, erklärte jedoch nachdrücklich, dass sie dies aus keinem anderen Grund taten, als die Sicherheit der geouteten Athleten zu schützen.
Andere Bedrohungen sind Naturkatastrophen, Zerstörung (entfernt oder physisch), Manipulation des Archivinhalts (siehe auch: Cyberangriff, Sicherungskopie), problematische Urheberrechtsgesetze und Überwachung der Benutzer der Website.
Alexander Rose, Geschäftsführer der Long Now-Stiftung, vermutet, dass auf lange Sicht über mehrere Generationen „so gut wie nichts“ auf nützliche Weise überleben wird, und erklärt: „Wenn wir in unserer technologischen Zivilisation Kontinuität haben, werden viele der nackten Daten meiner Meinung nach auffindbar und durchsuchbar bleiben. Aber ich vermuten, dass fast nichts vom Format, in dem es geliefert wurde, erkennbar sein wird", weil Websites "mit tiefen Back-Ends von Content-Management-Systemen wie Drupal und Ruby und Django" schwieriger zu archivieren sind.
In einem Artikel, der über die Bewahrung menschlichen Wissens nachdenkt, Der Atlantik hat kommentiert, dass das Internetarchiv, das sich selbst als langfristig angelegt bezeichnet, "arbeitet fieberhaft daran, Daten zu erfassen, bevor sie ohne nennenswerte langfristige Infrastruktur verschwinden."
{{cite web}}
: CS1-Wartung: archivierte Kopie als Titel (Link)
Wir haben die Möglichkeit hinzugefügt, eine Seite sofort zu archivieren und eine permanente URL für diese Seite in der Wayback-Maschine zurückzuerhalten. Dieser Dienst ermöglicht es jedem – Wikipedia-Redakteuren, Wissenschaftlern, Juristen, Studenten oder Hobbyköchen wie mir –, eine stabile URL zu erstellen, um alle Informationen zu zitieren, zu teilen oder mit einem Lesezeichen zu versehen, auf die sie auch in Zukunft Zugriff haben möchten.
2015: Die neuesten unter dieser IP-Adresse gehosteten URLs wurden von mindestens einem URL-Scanner oder bösartigen URL-Datensatz erkannt. ... 03/25 2-62-2015 03:25:16 /Renegotiating_TLS.pdf ... 14/12 1-62-2015 03:25:04 /CBLightSetup.exe
2015-03-25: Ein Teil dieser Website wurde in den letzten 138 Tagen 90 Mal wegen verdächtiger Aktivitäten gelistet. ... Was ist passiert, als Google diese Seite besucht hat? ... Von den 42410 Seiten, die wir in den letzten 90 Tagen auf der Website getestet haben, führten 450 Seiten dazu, dass bösartige Software ohne Zustimmung des Benutzers heruntergeladen und installiert wurde. Das letzte Mal, dass Google diese Website besuchte, war am 2015, und das letzte Mal, dass verdächtige Inhalte auf dieser Website gefunden wurden, war am 03. ... Schädliche Software umfasst 25 Trojaner, 2015 Viren, 03 Backdoors.
1) Dem Antrag von Internet Archive auf Abweisung der Gegenklage von Shell wegen Umwandlung und zivilrechtlichem Diebstahl (zweiter Klagegrund) wird GEWÄHRT. 2) Dem Antrag von Internet Archive auf Abweisung der Gegenklage von Shell auf Vertragsbruch (dritter Klagegrund) wird ABGELEHNT; 3) Dem Antrag von Internet Archive auf Abweisung der Gegenklage von Shell wegen Erpressung unter RICO und COCCA (vierter Klagegrund) wird GEWÄHRT.
Computer können im Namen von Menschen Verträge abschließen. Der Uniform Electronic Transactions Act (UETA) besagt, dass ein „Vertrag durch die Interaktion elektronischer Agenten der Parteien zustande kommen kann, selbst wenn keine Person von den Handlungen der elektronischen Agenten oder den daraus resultierenden Bedingungen und Vereinbarungen Kenntnis hatte oder sie überprüft hat“.
Noch wichtiger war, so das Gericht, dass das bloße Kopieren der Website von Shell durch das Internet Archive und deren Anzeige in seiner Datenbank nicht die erforderliche Ausübung der Herrschaft und Kontrolle über das Eigentum des Beklagten darstelle. Wichtig sei, so das Gericht, dass die Beklagte zu jeder Zeit ihre eigene Website besaß und betrieb. Das Gericht sagte: „Shell hat es versäumt, Tatsachen anzuführen, die belegen, dass Internet Archive die Herrschaft oder Kontrolle über ihre Website ausübte, da Shells Klage ausdrücklich besagt, dass sie die Website weiterhin besaß und betrieb, während sie auf der Wayback-Maschine archiviert wurde. Shell identifiziert keine Autorität, die die Vorstellung unterstützt, dass das Kopieren von Dokumenten an sich schon eine ausreichende Nutzungsentziehung ist, um die Konvertierung zu unterstützen. Umgekehrt haben zahlreiche Schaltungen festgestellt, dass dies nicht der Fall ist.'
Beide Parteien bedauern aufrichtig jeglichen Aufruhr, den die Klage für die andere verursacht haben könnte. Weder Internet Archive noch Ms. Shell dulden irgendein Verhalten, das einer der Parteien Schaden zugefügt haben könnte, das sich aus der öffentlichen Aufmerksamkeit für diese Klage ergibt. Die Parteien haben sich nicht an einem solchen Verhalten beteiligt und fordern, dass die öffentliche Reaktion auf die gütliche Beilegung dieses Rechtsstreits ihrem Wunsch entspricht, dass keiner der Parteien weiterer Schaden oder Aufruhr zugefügt wird.
Die Betreiber des Archivs fürchten neben Zensur und Manipulation der digitalen Aufzeichnungen demnach auch die Überwachung der Archiv-Nutzer. .