Zurück   WordPress Deutschland Forum > Café > Netzwelten
Registrieren Hilfe Benutzerliste Suchen Heutige Beiträge Alle Foren als gelesen markieren Threads ohne Antworten

Antwort
 
Themen-Optionen Ansicht
Alt 16.12.2007, 14:21   #1 (permalink)
CSe
PostRank: 0
 
Registriert seit: 23.11.2007
Beiträge: 11
Googlebot greift auf unsinnige URLs zu

Tach zusammen,

ich habe in meinen Logs Sonderbares gefunden.

Code:
66.249.72.180 - - [12/Dec/2007:02:26:43 +0100] "GET /qkwglcawns.html HTTP/1.1" 404 1038 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
66.249.72.180 - - [13/Dec/2007:05:01:35 +0100] "GET /dsnjnlleolztx.html HTTP/1.1" 404 1038 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
66.249.72.180 - - [15/Dec/2007:06:19:44 +0100] "GET /yzmudogotjmzap.html HTTP/1.1" 404 1038 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
66.249.72.180 - - [16/Dec/2007:07:41:49 +0100] "GET /wwwufbwrcgiaz.html HTTP/1.1" 404 1038 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
Ich habe Xenu Link Sleuth drüberlaufen lassen und finde keine Links, die zu diesen Seiten führen sollen. Ein Referrer ist beim Zugriff auch nicht angeben.

Interessant ist auch, dass bei drei dieser vier Zugriffe unmittelbar zuvor die leere robots.txt abgefragt wurde.

Kann mir bitte mal jemand erklären, die der Googlebot auf die blöde Idee kommt, diese komischen Dateinamen anzufordern? Das Ergebnis sind natürlich HTTP404, da diese Seiten nicht existieren.

Das geht jetzt schon seit knapp einem Jahr so. Bei Bedarf kann ich alle diese Zugriffe zur Verfügung stellen.
CSe ist offline  
Digg this Post!Add Post to del.icio.usBookmark Post in TechnoratiWong this Post!
Mit Zitat antworten
Alt 16.12.2007, 18:38   #2 (permalink)
Ammaletu
PostRank: 9
 
Benutzerbild von Ammaletu
 
Registriert seit: 14.07.2007
Beiträge: 1.181
Ich hab letztens mal über den Yahoobot gelesen, dass der das absichtlich macht, um zu sehen, wie Seiten mit 404-Fehlern umgehen. Es gibt ja diese nervigen Seiten, die jede Eingabe akzeptieren und daraus eine Seite generieren mit wenig bis keinem Bezug zur Eingabe, dafür aber mit viel Werbung drauf. Um solche Spam-Seiten besser zu erkennen, versucht der Yahoo-Bot, mit einer definitiv falschen URL herauszufinden, ob eine bestimmte Website einen 404 zurückschickt. Habe leider keinen Link parat, könnte mir aber vorstellen, dass es sich bei deinen Aufrufen vom Googlebot um die gleiche Sache handelt.
__________________
"Life brings hope and pain, but revenge never brings redemption." || Mein Blog
Ammaletu ist offline  
Digg this Post!Add Post to del.icio.usBookmark Post in TechnoratiWong this Post!
Mit Zitat antworten
Antwort


Themen-Optionen
Ansicht

Forumregeln
Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge anzufügen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

vB Code ist An.
Smileys sind An.
[IMG] Code ist Aus.
HTML-Code ist Aus.
Trackbacks are An
Pingbacks are Aus
Refbacks are Aus


Alle Zeitangaben in WEZ +2. Es ist jetzt 08:17 Uhr.


Sponsoren:

Powered by vBulletin® Version 3.6.8 (Deutsch)
Copyright ©2000 - 2008, Jelsoft Enterprises Ltd.
Content Relevant URLs by vBSEO 3.0.0  — ImpressumEin Inpsyde.com Projekt