Supportnet Computer
Planet of Tech

Supportnet / Forum / Webseiten/HTML

Abspeichern von Homepagedateien





Frage

Hallo Leute ein mir rätselhaftes Phänomen: ich will eine Homepage aus dem Netz lokal auf meiner Platte speichern, einfach über "Datei ---> Seite speichern unter" (FF2). Dabei wird für alle Dateien, die sich nicht im selben Ordner befinden wie die webseite, also zB Bilddateien u.ä., ein neuer Ordner angelegt. Ärgerlich dabei ist jedoch, daß sich dadurch alle Verweise verändern. Wenn ich also den Quelltext der bearbeiteten lokalen Kopie wieder im Netz poste (zB um hier im Forum Veränderungen am Quelltext zu demonstrieren), kann der Ursprungsautor den Quelltext nicht einfach so übernehmen, da sich ja alle Verweise verändert haben. Kann man das irgendwie beeinflussen? [b]Aber das weitaus größere Problem[/b] sehe ich darin, daß ganz neue Tags eingefügt werden. Ein Beispiel: Aus einer online verfügbaren Webseite kann ich mir über den Browser den Quelltext anzeigen lassen: [code][b]<table width="800" border="0" cellpadding="FFFFCC"> <tr> <td bgcolor="CAE8BB" height="25" width="120"> <table border="0" cellpadding="0" cellspacing="0" width="120"> <tr> [/b][/code] Meine lokale Kopie dieser Webseite macht daraus: [code][b]<table border="0" cellpadding="FFFFCC" width="800"> <tbody><tr> <td bgcolor="#cae8bb" height="25" width="120"> <table border="0" cellpadding="0" cellspacing="0" width="120"> <tbody><tr> [/b][/code] Es werden also in der ersten Zeile die Anweisungen innerhalb des table-Tags umgedreht und zweimal wird überflüssigerweise ein tbody-Tag eingefügt, der online gar nicht vorhanden zu sein scheint. Wie kommt das????? fragt sich derpfleger

Antwort 1 von Supermax

Beim Speichern der Seite müssen ja teilweise die Verweise umgeschrieben werden, um eben auf die Datei auf deiner Festplatte und nicht am Server zuzugreifen. Ich vermute mal der Browser "zerlegt" die Webseite im sog. "Document Object Model", führt dort die entsprechenden Anpassungen durch und erstellt dann aus dieser internen Baumstruktur die auf der Platte gespeicherte Seite. Während der Auswertung (parsing) des Dokuments werden teilweise fehlende oder unvollständige, aber laut Standard benötigte bzw. empfohlene Elemente ergänzt.. Ich denke mal daß beim Speichern die Attribute einfach in alphabetischer Reihenfolge gespeichert werden, deswegen erscheinen "border" und "bgcolor" dann vor "width":

Antwort 2 von derpfleger

OK, wäre eine Erklärung für alle Phänomene bis auf die Tatsache, daß ein tbody eingefügt wird.

Woher kommt denn das????

fragt sich derpfleger

Antwort 3 von rfb

tbody ist in einer Datentabelle sinnvoll (allerdings müssen dann auch thead und tfoot angegeben werden). Dein Browser geht wohl davon aus, dass alle Tabellen Datentabellen sind. Das ist eine sinnvolle Annhame, spiegelt aber die Realität leider nicht wieder.

Sinnvoller für deine Zwecke ist wohl irgendein Websitegrabber, also ein spiezielles Programm.
Versuch doch mal HTTrack, dafür gibts wohl auch einen Aufsatz für FF ("Spiderzilla" oder so ähnlich genannt).

Antwort 4 von derpfleger

Spiderzilla, jep, das funktioniert tatsächlich.
Thx derpfleger