[PHP] Webseite komplett runterladen

unregiert

abgemeldet
22 April 2006
451
26
Servus

Ich bräuchte eine kleine Hilfe von euch. Ich möchte einige Seiten komplett runterladen, und dessen Inhalte (Grafiken, JS-Scripts) in einen Ordner packen, so wie es zum Beispiel Firefox bei CTRL+S macht. Nun: Die "Ausgabe" kann ich in eine HTML Datei packen - aber wie schaffe ich es, die Grafiken und JS-Scripts zu holen, die im Dokument mit src="./blabla.gif" (ohne kompletten URL) angezeigt werden, auch abzuspeichern? Also, dass ich schliesslich einen Backup der Seite habe?

Hoffentlich versteht ihr mich und könnt mir einige Tipps geben, wie man soetwas verwirklichen kann.
 
Naja, ich würde alles mit einem RegExp nach einem src="...." durchsuchen lassen und dass dann mit downloaden.
Aber warum muss das in PHP sein ? Desktop-Tools wie der Browser oder DL-Managers machen das doch viel besser ;)
 
such mal bei Google nach der Fireofx-Extension "Spiderzilla"...

Edit: Achso du willst das mit PHP machen...das kommt davon wenn man 100 Tabs aufeinmal auf hat....*grml*
 
theHacker schrieb:
Naja, ich würde alles mit einem RegExp nach einem src="...." durchsuchen lassen und dass dann mit downloaden.
Aber warum muss das in PHP sein ? Desktop-Tools wie der Browser oder DL-Managers machen das doch viel besser ;)
Wieso es gerade PHP sein muss, kann ich dir sagen. Würde ich es mit einem Freeware-Tool machen, hätte ich nichts davon ;) Und so lerne ich nebenbei etwas dazu. :)
 
theHacker schrieb:
Naja, ich würde alles mit einem RegExp nach einem src="...." durchsuchen lassen und dass dann mit downloaden.

Jop so in der Richtung, musst halt nur bedenken dass es src="" und src='' gibt und absolute und relative Pfade.

Theorethisch kannst du dann auch nachher die Bilder Inline ins HTML Dokument einbauen durch <img src="data:image/{extension};base64,{base64-bild-inhalt}" />.

Probieren geht über studieren :)

Grüße,
artemissays