Verzeichnisse herunterladen

Hinweis: Wenn Sie einen Mac verwenden und die ZIP-Datei, die Sie heruntergeladen haben, eine Datei größer als 4 GB enthält, kann das Tool Archive Utility unter MacOS den Inhalt der ZIP-Datei möglicherweise nicht extrahieren. In diesem Fall müssen Sie eine andere Software oder das Terminalprogramm verwenden, um die Dateien zu extrahieren. chrome.google.com/webstore/detail/download-master/dljdacfojgikogldjffnkdcielnklkce wget funktioniert in der Regel auf diese Weise, aber einige Websites können Probleme haben und es kann zu viele unnötige HTML-Dateien erstellen. Um diese Arbeit zu erleichtern und unnötige Dateierstellung zu verhindern, teile ich mein getwebfolder-Skript, das das erste Linux-Skript ist, das ich für mich selbst geschrieben habe. Dieses Skript lädt den gesamten Inhalt eines als Parameter eingegebenen Webordners herunter. Im Wesentlichen ein echter Schmerz zu versuchen, manuell für die spätere Verwendung herunterladen. und gehen Sie auf die Seite (von wo aus Sie Dateien herunterladen möchten), und klicken Sie auf dieses Lesezeichen. Das einfachste Dienstprogramm zum rekursiven Herunterladen der Dateien von der Website ist WGET: `-nH` `—no-host-directories` Die Generierung von Host-Präfixiertverzeichnissen deaktivieren. Standardmäßig wird durch Aufrufen von Wget mit `-r fly.srk.fer.hr/` eine Struktur von Verzeichnissen erstellt, die mit fly.srk.fer.hr/ beginnen. Diese Option deaktiviert ein solches Verhalten.

Es ermöglicht Ihnen, eine World Wide Web-Site aus dem Internet in ein lokales Verzeichnis herunterzuladen, rekursiv alle Verzeichnisse zu erstellen, HTML, Bilder und andere Dateien vom Server auf Ihren Computer zu erhalten. HTTrack ordnet die relative Linkstruktur der ursprünglichen Site an. Öffnen Sie einfach eine Seite der «gespiegelten» Website in Ihrem Browser, und Sie können die Website von Link zu Link durchsuchen, als ob Sie sie online ansehen würden. HTTrack kann auch eine vorhandene gespiegelte Website aktualisieren und unterbrochene Downloads fortsetzen. HTTrack ist vollständig konfigurierbar und verfügt über ein integriertes Hilfesystem. Referenz: bmwieczorek.wordpress.com/2008/10/01/wget-recursively-download-all-files-from-certain-directory-listed-by-apache/ `-np` `—no-parent` Steigen Sie beim rekursiven Abrufen nicht in das übergeordnete Verzeichnis auf. Dies ist eine nützliche Option, da es garantiert, dass nur die Dateien unterhalb einer bestimmten Hierarchie heruntergeladen werden. Weitere Informationen finden Sie unter Directory-Based Limits. Ich habe dieses Dienstprogramm ausprobiert und entweder ist es Overkill, oder nicht-einfach-genug-kill, weil ich es nie bekommen konnte, um nur Dateien auf meine Festplatte herunterzuladen.