Informationen für Bots unsichtbar

Diese Seite verwendet Cookies. Durch die Nutzung unserer Seite erklären Sie sich damit einverstanden, dass wir Cookies setzen. Weitere Informationen

  • Informationen für Bots unsichtbar

    Hallo,
    ist es irgendwie möglich Informationen so auf einer Webseite zu platzieren, das ein Bot sie nicht lesen kann, ein Mensch aber durchaus?
    Und um es noch ein bischen komplizirter zu machen: Kann man irgendwie Links so erstellen, das sie zwar funktionieren, aber ein Bot auch aus dem Quelltext nicht schlau wird?

    Bei letzterem hab ich ja eher wenig Hoffnungen...
    Trotzdem würd ich mich über Antworten freuen.
  • Es gibt die Möglichkeit via robots.txt Verzeichnisse für Bots zu sperren.
    Wobei ich nicht sagen kann inweiweit sich dran gehalten wird.

    z.B (robots.txt)

    Quellcode

    1. # Alle Robots ausschließen
    2. User-agent: *
    3. Disallow: /temp/

    Wobei temp für den Ordnnernamen steht.

    Quelle:
    bjoernsworld.de/suchmaschinen/robots-txt.html


    Ob man einen Link "verschlüsseln" kann?
    Man kann es durch Hexangaben versuchen. Wobei ich nicht weiß, ob diese dann von der Html Engine richtig interpretiert werden.
  • Hm,
    die Bots die ich aussperren möchte, werden sich mit ziemlicher Sicherheit nicht an solche Vorgaben halten!
    Es geht darum das ich die Informationen eines Impressums nicht beim nächst besten Spammbot wiederfinden möchte.
    Der verschlüßelte Link soll eine E-Mail Adresse sein, die zwar dem Nutzer den Komfort bietet, das man nur drauf klicken braucht und sich das E-Mail Fenster öffnet, aber eben auch der SpammBot möglichst nicht ohne weiteres an die Adresse kommt.
    Aber wie gesagt, für letzteres sehe ich eher schwarz.
  • Hm, die Java-Script Variante scheint für mich auf die schnelle am praktikabelsten.
    Nun bin ich aber ei Noob in Sachen JavaScript, daher wüsste ich gern eure Meinung zu folgender Lösung:

    Test.js:

    Quellcode

    1. var mailpart1 = "foo";
    2. var mailpart2 = "@";
    3. var mailpart3 = "bar.baz";
    4. var mailcompl = mailpart1 + mailpart2 + mailpart3;
    5. var textpart1 = "Hier";
    6. var textpart2 = "steht";
    7. var foobar = "Unsinn!";
    8. var anothertext = textpart1 + textpart2;


    Test.html:

    Quellcode

    1. <html>
    2. <head>
    3. <title></title>
    4. <script src="Test.js" type="text/javascript"></script>
    5. </head>
    6. <body text="#000000" bgcolor="#FFFFFF" link="#FF0000" alink="#FF0000" vlink="#FF0000">
    7. <script type="text/javascript">
    8. <!--
    9. document.write("<a href=" + "mail" + "to:" + mailpart1 + mailpart2 + mailpart3 + ">" + mailcompl + "</a><br>");
    10. document.write(anothertext + " " + foobar);
    11. //-->
    12. </script>
    13. </body>
    14. </html>
    Alles anzeigen


    Edith sagt ich sollte vielleicht noch erklären was ich mir dabei gedacht habe die Sachen so zu stückeln und in eine andere Datei zu verfrachten.
    Ich habe vor nicht nur eine E-Mail Adresse, sondern auch eine richtige Adresse damit zu maskieren. Schreibe ich alles in eine Variable, wird es doch all zu leicht für einen Bot das aus zu lesen. Außerdem möchte ich die E-Mail Adresse auch auf anderen Seiten als dem Impressum verwenden. Auf die weise muss ich das nicht für jede Seite neu schreiben.
  • Also ich weiß ja nicht, in wieweit oder wie gut Bots HTMl und/oder CSS parsen, aber wenn du Pesch hast, dann gibt es vllt. auch Bots, die JavaScript/Flash/Java (Applets) interpretieren. Und wenn er deinen Code interpretieren würde, dann wäre es ein Leichtes die E-Mail Adresse zu speichern. Apropos Flash, das wäre vielleicht auch noch eine Idee, wenn man das Impressum in Flash darstellen würde. Aber was, wenn der Bot auch Flash interpretieren kann? ...
    Also ich denke mal, dass das Sicherste entweder über ein Captcha oder Bilder ist.
    Open Source --> Programmieren aus Leidenschaft :!:

    Ich stehe weder für privaten Support per PM noch über einen IM zur Verfügung. Danke.
  • Deadman44 schrieb:

    Also ich weiß ja nicht, in wieweit oder wie gut Bots HTMl und/oder CSS parsen, aber wenn du Pesch hast, dann gibt es vllt. auch Bots, die JavaScript/Flash/Java (Applets) interpretieren.


    Das kann schon gut möglich sein, aber wenn du die variablen noch weiter mischst, dann ist die Wahrscheinlichkeit bei 0,001%, dass da ein Bot dahinterkommt.

    Quellcode

    1. var fasdf = "fo";
    2. var jfhjgh= "o";
    3. var yvxcvxc= "@";
    4. var rtsret= "bar";
    5. var jjghj= ".";
    6. var adfas= "ba";
    7. var cvbcv= "baz";




    Dann noch ein bischen shuffeln und dann will ich den Bot sehen, der die Mail Adresse parst, ohne, dass er auf diese Page zugeschnitten geschrieben wurde :D

    Quellcode

    1. var jfhjgh= "o";
    2. var adfas= "ba";
    3. var jjghj= ".";
    4. var fasdf = "fo";
    5. var cvbcv= "baz";
    6. var rtsret= "bar";
    7. var yvxcvxc= "@";
    8. <script type="text/javascript">
    9. <!--
    10. document.write("<" + "a h" + "re" + "f=" + "m" + "ai" + "l" + "t" + "o:" + fasdf + jfhjgh + yvxcvxc + rtsret + jjghj + adfas + cvbcv">
    11. " + "m" + "ai" + "l" + "t" + "o:" + fasdf + jfhjgh + yvxcvxc + rtsret + jjghj + adfas + cvbcv"</" + "a" + "><br>");
    12. //-->
    13. </script>
    Alles anzeigen


    Das einzige, was diesen Code als eMail Adresse verrät ist das @ Zeichen, was man ggf. noch unkenntlichen machen könnte.
  • vince schrieb:

    Dann noch ein bischen shuffeln und dann will ich den Bot sehen, der die Mail Adresse parst, ohne, dass er auf diese Page zugeschnitten geschrieben wurde :D

    Quellcode

    1. var jfhjgh= "o";
    2. var adfas= "ba";
    3. var jjghj= ".";
    4. var fasdf = "fo";
    5. var cvbcv= "baz";
    6. var rtsret= "bar";
    7. var yvxcvxc= "@";
    8. <script type="text/javascript">
    9. <!--
    10. document.write("<" + "a h" + "re" + "f=" + "m" + "ai" + "l" + "t" + "o:" + fasdf + jfhjgh + yvxcvxc + rtsret + jjghj + adfas + cvbcv">
    11. " + "m" + "ai" + "l" + "t" + "o:" + fasdf + jfhjgh + yvxcvxc + rtsret + jjghj + adfas + cvbcv"</" + "a" + "><br>");
    12. //-->
    13. </script>
    Alles anzeigen


    Das einzige, was diesen Code als eMail Adresse verrät ist das @ Zeichen, was man ggf. noch unkenntlichen machen könnte.
    Wenn der Bot aber den JavaScript interpretiert, d.h. er schaut sich nicht den Quellcode an, sondern das was rauskommt, dann hat er leichtes Spiel, weil die Adress-Link ja dann im Klartext dasteht. Warum sollte ein Bot das was ein Browser kann nicht auch können? Also wenn ich nen Bot entwickeln würd, würd ichs so machen ;)
  • Das hier wäre vielleicht auch noch eine Idee:

    Quellcode

    1. <?xml version="1.0" encoding="utf-8" ?>
    2. <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN"
    3. "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
    4. <html xmlns="http://www.w3.org/1999/xhtml" xml:lang="en">
    5. <head>
    6. <meta http-equiv="content-type" content="text/html; charset=utf-8" />
    7. <title>Informationen für Bots unsichtbar machen</title>
    8. <script type="text/javascript">
    9. function anzeigen() {
    10. document.getElementById("impressum").style.visibility = "visible";
    11. }
    12. </script>
    13. <style type="text/css">
    14. #impressum {
    15. visibility:hidden;
    16. }
    17. </style>
    18. </head>
    19. <body>
    20. <p>
    21. <a href="javascript:anzeigen()">Impressum anzeigen</a>
    22. </p>
    23. <p id="impressum">
    24. Hans Mustermann <br />
    25. Winkelgasse 14 <br />
    26. <br />
    27. 65546 Musterstadt
    28. </p>
    29. </body>
    30. </html>
    Alles anzeigen

    Das Impressum dann vielleicht noch etwas shuffeln. die Buchstaben mit Hexa- oder Dezimalangaben ersetzen. Dann würden die meisten Bots wohl dran verzweifeln.


    Zitat von »vince«
    ...
    Das einzige, was diesen Code als eMail Adresse verrät ist das @ Zeichen, was man ggf. noch unkenntlichen machen könnte.


    Verrätst du mir wie?

    Mit

    Quellcode

    1. @

    Also mit ASCII Codes in deinem Quellcode.
    Open Source --> Programmieren aus Leidenschaft :!:

    Ich stehe weder für privaten Support per PM noch über einen IM zur Verfügung. Danke.
  • Ich würde als einfach ein kleines Bild einfügen, das die Adresse und Mail enthält, das farblich zum Rest der Seite passt, dann fällts auch net so auf, ausser der User hat die Farben festgelegt. Aber da isses dann eh wurscht.
    mfg
    Sometimes it pays to stay in bed in Monday, rather than spending the rest of the week debugging Monday's code. ~Dan Salomon
  • superuser schrieb:

    Ich würde als einfach ein kleines Bild einfügen, das die Adresse und Mail enthält,

    Aber da ist die Barrierefreiheit nicht mehr gewährleistet, die Blinde und nicht mehr gut sehende Benutzer bräuchten, da sie einen Screenreader benutzen. Und je nachdem welche Seite man macht (afaik auf staatlicher Ebene) müssen alle Informationen barrierefrei bereitgestellt werden und das gilt auch für das Impressum.
    Open Source --> Programmieren aus Leidenschaft :!:

    Ich stehe weder für privaten Support per PM noch über einen IM zur Verfügung. Danke.
  • Hui,
    da guckt man mal einige Tage hier nicht mehr rein, und dann sowas.
    Ich wusste garnicht das ich damit so eine Diskussion auslösen würde.
    Thema Barrierefrei: Naja, es handelt sich um die Hompage meiner Band, ich denke man kann es aus rechtlicher Sicht verschmerzen wenn es nicht barrierefrei ist, aber mein persönliches Wohlbefinden würde es schon steigern wenn auch Blinde mit uns in Kontakt treten könntetn.
    Ich bin bisher noch nicht dazu gekommen das auch um zu setzen, aber ich denke ich werde die weiter oben bereits angeführte Java-Script varriante benutzen.

    Vielen Dank euch!