wget --spider und php

Diese Seite verwendet Cookies. Durch die Nutzung unserer Seite erklären Sie sich damit einverstanden, dass wir Cookies setzen. Weitere Informationen

  • wget --spider und php

    Hallo zusammen,

    kann mir einer sagen warum wget --spider bei manchen php Seiten nicht genügt um die Scripts auszuführen und bei anderen wiederum schon?
    Laut man-Page schaut wget --spider nur nach ob die Datei existiert. Bei einigen Seiten reicht das schon um den PHP Inhalt auszuführen. Bei anderen passiert PHP technisch garnix, als
    würde die Seite nie aufgerufen. Woran liegt das? An der Ladezeit? Wie ist das Muster?

    Beste Grüße,
    X-Eon
  • Ich weiß es nicht, aber ich spekuliere nur.

    Die Manpage zu wget verrät:
    --spider
    When invoked with this option, Wget will behave as a Web spider, which means that it will not download the pages, just check that they are there. For example, you can use Wget to check your bookmarks:


    Nun habe ich mich gefragt, wie würdest du das realisieren. Wenn ich den Content nicht laden will, aber wissen will ob die Seite existiert.
    HTTP handelt keinen Handshake aus. Anfrage => Antwort, fertig
    Was aber passiert, wenn du die Seite schonmal besucht hast, dann wird in der GET Abfrage das Datum mitgeliefert an dem du die Seite zuletzt geladen hast - der Webserver muss den Content also nicht neu generieren, wenn dieses Datum in der Zukunft liegt?

    Bleibt jedoch die Frage, warum manche PHP Dokumente heruntergeladen werden und manche nicht. Bei statischen Dateien wie html, js, etc erübrigt sich die Frage. Da ist das Last-Modfied Datum automatisch der letzte Schreibzugriff.
    Ohne spezielle Konfiguration sendet dein PHP Dokument immer den aktuellen Zeitpunkte als Last-Modified Zeitpunkt.
    Wenn du dir aber als Programmierer sicher bist, dass zum Beispiel der letzte Forenbeitrag zum Zeitpunkt x stattgefunden hast - dann kannst du diesen Zeitpunkt natürlich senden. Hast du dies irgendwo getan?
  • Nein nein. Am Last-Modified habe ich gar nichts geändert. Und es ist auch nicht so das ein und das selbe Script mal geht und mal nicht.
    Einige funktionieren so - immer. Andere gar nicht. Und alle machen nichts anderes als Datenbankeinträge zu verändern oder löschen.

    Mir fällt eigentlich kein Grund ein, warum es bei einigen geht und bei anderen nicht. Es sind keine besonderen Funktionen oder Einstellungen drin.
    Das einzige was z.T. deutlich unterschiedlich ist, ist die Laufzeit ... aber wie gesagt ... wenn es läuft, dann läuft es immer.

    Ist schon strange ;)