Unter dem folgenden link herunterladen

Dies ist das Gegenteil der Option `-follow-tags`. Um bestimmte HTML-Tags zu überspringen, wenn Sie rekursiv nach zum Herunterladen von Dokumenten suchen, geben Sie sie in einer durch Kommas getrennten Liste an. Diese Datei dokumentiert das GNU Wget-Dienstprogramm zum Herunterladen von Netzwerkdaten. Wenn Sie `nocontrol` angeben, wird auch das Entweichen der Steuerzeichen deaktiviert. Diese Option kann sinnvoll sein, wenn Sie URLs herunterladen, deren Namen UTF-8-Zeichen enthalten, auf einem System, das Dateinamen in UTF-8 speichern und anzeigen kann (einige mögliche Bytewerte, die in UTF-8-Bytesequenzen verwendet werden, fallen in den von Wget als ”Steuerelemente” bezeichneten Wertebereich). Der beliebteste Mechanismus und der De-facto-Standard, der von allen großen Robotern unterstützt wird, ist der ”Robots Exclusion Standard” (RES), der 1994 von Martijn Koster et al. geschrieben wurde. Es gibt das Format einer Textdatei an, die Direktiven enthält, die die Roboter anweisen, welche URL-Pfade zu vermeiden sind. Um von den Robotern gefunden zu werden, müssen die Spezifikationen in /robots.txt im Serverstamm platziert werden, den die Roboter herunterladen und analysieren sollen. Aber Links sind keine Server, sie sind Wegbeschreibungen und so können Sie es an diesem beliebigen Ort finden, unabhängig vom tatsächlichen Standort. In Kombination mit `–metalink-over-http` und `–trust-server-names` wird eine Datei `Content-Type: application/metalink4+xml` mit dem Dateinamenfeld Content-Disposition benannt, sofern verfügbar. Wenn ein Wiki öffentlich ist und die Websitebesitzer nichts dagegen haben, den Inhalt zu teilen, stellen sie in der Regel ein herunterladbares Backend (Datenbank oder was auch immer) bereit.

Also würden Sie einfach das Datenpaket herunterladen, eine lokale Instanz desselben Wiki-Moduls einrichten, die Daten hineinimportieren und eine lokale Kopie haben. Danach, wenn Sie möchten, können Sie die Blutegel vor Ort tun. Nach dem Download zeigt eine lokale Verzeichnisliste an, dass die Zeitstempel mit denen auf dem Remoteserver übereinstimmen. Wenn Sie den Befehl mit `-N` erneut ausgeben, ruft Wget nur die Dateien wieder ab, die seit dem letzten Download geändert wurden. Diese Option ist nützlich für einige CGI-Programme, die CGI-Programme herunterladen, die Content-Disposition-Header verwenden, um den Namen einer heruntergeladenen Datei zu beschreiben. Wenn Wget mit dieser Option aufgerufen wird, verhält es sich wie eine Web-Spinne, was bedeutet, dass es die Seiten nicht herunterlädt, sondern einfach überprüft, ob sie vorhanden sind. Sie können z. B. Wget verwenden, um Ihre Lesezeichen zu überprüfen: Die Dokumente werden nicht in die entsprechenden Dateien geschrieben, sondern alle werden zusammen verkettet und in die Datei geschrieben. Wenn `-` als Datei verwendet wird, werden Dokumente in die Standardausgabe gedruckt, wodurch die Linkkonvertierung deaktiviert wird. (Verwenden Sie `./-`, um in eine Datei mit dem wörtlichen Namen `-` zu drucken.) Beschränken Sie die Downloadgeschwindigkeit auf 1,25 000 Byte pro Sekunde. Der Betrag kann in Bytes, Kilobyte mit dem Suffix ”k” oder Megabyte mit dem Suffix `m` ausgedrückt werden.

Beispielsweise beschränkt `–limit-rate=20k` die Abrufrate auf 20 KB/s. Dies ist nützlich, wenn Sie aus welchen Gründen auch immer nicht möchten, dass Wget die gesamte verfügbare Bandbreite verbraucht. Standardmäßig entgeht Wget den Zeichen, die als Teil von Dateinamen auf Ihrem Betriebssystem ungültig oder sicher sind, sowie Steuerzeichen, die normalerweise nicht druckbar sind. Diese Option ist nützlich, um diese Standardeinstellungen zu ändern, z. B. weil Sie auf eine nicht systemeigene Partition herunterladen oder weil Sie das Entweichen der Steuerzeichen deaktivieren möchten, oder weil Sie Zeichen weiter auf Zeichen im ASCII-Wertebereich beschränken möchten.