192 Aufrufe
Gefragt in Linux von
Hallo zusammen,

ich kann mit wget PDF-Dateien von Webseiten herunterladen.

Auf einer Seite erzeugt das verwendete CMS aber Links auf die PDF-Dateien in folgendem Stile:

http://seite.de/pfad/dateiname.pdf?pdfdownload

Wenn ich nur http://seite.de/pfad/dateiname.pdf aufrufe erhalte ich eine HTML-Seite mit dem Link auf http://seite.de/pfad/dateiname.pdf?pdfdownload

Wenn ich http://seite.de/pfad/dateiname.pdf?pdfdownload im Browser aufrufe dann erhalte ich die PDF-Datei.

Die Frage ist jetzt: Wie kann ich (wenn überhaupt) wget beibringen die PDF-Dateien mit dem Zusatz ?pdfdownload zu versehen?

4 Antworten

0 Punkte
Beantwortet von flupo Profi (17.1k Punkte)
Ich verstehe das Problem noch nicht ganz. Wget ist ja ein Kommandozeilentool, dass in der Regel in Batchdateien genutzt wird. Da sollte sich der passende String doch zusammenbasteln lassen.

Gruß Flupo
0 Punkte
Beantwortet von
Hallo,

danke für die Antwort.

Ich nutze wget auch per Konsole um die PDF-Dateien einer Website herunterzuladen:
wget -r -A pdf http... (andere Parameter habe ich jetzt mal weggelassen zwecks Übersichtlichkeit)

Dadurch bekommen ich die PDF-Dateien, außer im oben beschriebenen Fall, wenn die Datei nur mit dem URL-Parameter erreichbar ist.
0 Punkte
Beantwortet von halfstone Profi (17.7k Punkte)
Hi,

so langsam verstehe ich dein Problem, mit wget und einer Datei bekommst du es hin, da du die URL mit dem "pdfdownload" am Ende mit angeben kannst.

Wenn du aber per wget rekursiv die ganzen Verzeichnisse runterladen willst, dann fehlt eben das "pdfdownload" am Ende.

Hab echt ne Weile gebraucht bis ich das verstanden habe.

Du wirst wohl nicht drum rum kommen dir ein Script zu schreiben, dass erst mal alle möglichen URLs in eine Liste schreibt und dann am Ende jeder Zeile das "pdfdownload" anhängt und diese Liste dann wget zu übergeben.

Habe ich es so richtig verstanden?

Gruß Fabian
0 Punkte
Beantwortet von
Hallo Fabian,

ja das ist korrekt. Ich werde das nächste mal etwas ausführlicher mein Problem schildern und hoffe das du dir nicht zu viele Gedanken gemacht hast.

Ich habe das von dir geschilderte Vorgehen schon geahnt und wollte es mir einfacher machen, aber wohl ohne Erfolg.

Die Frage hat sich damit erledigt, Danke.
...