Zurück   WordPress Deutschland Forum > Café > Netzwelten
Registrieren Hilfe Benutzerliste Suchen Heutige Beiträge Alle Foren als gelesen markieren Threads ohne Antworten

Antwort
 
Themen-Optionen Ansicht
Alt 31.01.2008, 12:00   #21 (permalink)
Putzlowitsch
PostRank: 10
 
Benutzerbild von Putzlowitsch
 
Registriert seit: 21.10.2006
Beiträge: 1.831
Zitat:
Zitat von Alphawolf Beitrag anzeigen
...
Für mich klingt dabei dann die Google Toolbar Idee am schlüssigsten irgendwie (obwohl es schon komisch ist, dass deine Wortschöpfungen gesucht werden). Man müsste dazu mal mit diesem Plugin gegenchecken, welche Wörter die User in das Suchform eintragen und suchen und welche Wörter der Googlebot einträgt. Vielleicht gibt's da ja ne Kongruenz.
Für mich klingt die Google-Toolbar-Theorie überhaupt nicht schlüssig
Meine Auswertung der Logfiles hat ergeben, das wie oben bereits erwähnt, Google bisher 2155 mal meine Blogsuche mit 770 unterschiedlichen Wörtern befragt hat. Normale Nutzer haben bisher 136 mal nach 103 verschiedene Wörtern (und Wortkombinationen, das macht Google nicht) gesucht. Es gibt aber nur ganze 9 (in Worten: neun) Überschneidungen.

Gruß
Ingo
__________________
http://putzlowitsch.de WP 2.1.3 bei All-Inkl und Strato (schnurpsel.de)
Putzlowitsch ist offline  
Digg this Post!Add Post to del.icio.usBookmark Post in TechnoratiWong this Post!
Mit Zitat antworten
Alt 31.01.2008, 12:39   #22 (permalink)
Alphawolf
WPD-Moderator
 
Registriert seit: 31.05.2005
Ort: Gera
Beiträge: 1.835
Ich probiere das jetzt auch mal mit dem SearchMeter Plugin zum Abgleichen.

Hier gibt's übrigens ähnliche Meinungen wie hier: Googlebot going through internal search forms

Auch interessant: Google indexing large volumes of (unlinked?) dynamic pages
(Ich weiß, viel zu lesen )..

Was mich wundert ist, dass überall gesagt wird, dass Google nie ein Formular abschicken wird (es sei denn, du willst es für geschützte Seiten). Offenbar hat sich dies aber geändert, wenn ich mir dieses Patent anschaue: United States Patent Application: 0060230033
Ich kann mir aber dennoch nicht vorstellen, dass der Bot zufällige Abfragen ausführt, sondern dass die irgendwo herkommen und Google sie nur ausführt, und so vielleicht "menschlicher" agieren soll (indem er "human queries" crawlt). Das würde IMO wieder für die Toolbar/Analytics Theorie sprechen.. leider bisher nur eine Theorie.
__________________
Erweiterungen

Geändert von Alphawolf (31.01.2008 um 12:43 Uhr).
Alphawolf ist offline  
Digg this Post!Add Post to del.icio.usBookmark Post in TechnoratiWong this Post!
Mit Zitat antworten
Alt 31.01.2008, 14:04   #23 (permalink)
Putzlowitsch
PostRank: 10
 
Benutzerbild von Putzlowitsch
 
Registriert seit: 21.10.2006
Beiträge: 1.831
Naja, zumindest zeigen mir die Links, das ich nicht der einzige bin, der das beobachtet hat und sich darüber Gedanken macht.

Wobei ich die Toolbar/Analytics-Theorie wohl irgendwie noch nicht ganz verstanden habe. Ich verwende weder das eine, noch das andere.

Gruß
Ingo
__________________
http://putzlowitsch.de WP 2.1.3 bei All-Inkl und Strato (schnurpsel.de)
Putzlowitsch ist offline  
Digg this Post!Add Post to del.icio.usBookmark Post in TechnoratiWong this Post!
Mit Zitat antworten
Alt 31.01.2008, 14:09   #24 (permalink)
spickzettel
PostRank: 6
 
Registriert seit: 19.01.2006
Beiträge: 694
Das (aus dem zweiten Link) scheint mir auch plausibel:

Zitat:
- Googlebot is spidering GET forms by getting the form variables and either leaving them blank or assigning values to them (sometimes taken from options in the form itself)
- Google has a list of words present on the site
- This list of words is being used to populate the form variables, and the URL requested via GET

...

It would be an odd thing to do, but would allow Google to access data that would previously be hidden to spidering, I suppose. (Hervorhebung von mir)
spickzettel ist offline  
Digg this Post!Add Post to del.icio.usBookmark Post in TechnoratiWong this Post!
Mit Zitat antworten
Alt 31.01.2008, 14:35   #25 (permalink)
Putzlowitsch
PostRank: 10
 
Benutzerbild von Putzlowitsch
 
Registriert seit: 21.10.2006
Beiträge: 1.831
Das ist ja im Prinzip genau das, was ich behaupte "Googlebot erstellt selbst Suchanfragen"

Er nimmt halt nicht nur Links, die er irgendwann mal irgendwo "gesehen" hat, sondern baut mit den GET-Variablen und der Wortliste selbständig Anfragen zusammen. Das Google niemals nicht selbständig Formulare ausfüllt, kann man also so nicht mehr sagen.

Gruß
Ingo
__________________
http://putzlowitsch.de WP 2.1.3 bei All-Inkl und Strato (schnurpsel.de)
Putzlowitsch ist offline  
Digg this Post!Add Post to del.icio.usBookmark Post in TechnoratiWong this Post!
Mit Zitat antworten
Alt 01.02.2008, 23:57   #26 (permalink)
ben
PostRank: 5
 
Registriert seit: 15.06.2005
Beiträge: 424
dies kommt bei mir auch vermehrt vor.

ich würde mir das so erklären:

google möchte ihre suchergebnisse verbessern, und vielleicht irgendwie eine art semantische suche aufbauen.

wenn der G-bot auf ein wort stößt, welches auf dem weblog ungewöhnlich oft vorkommt, oder gar gänzlich neu ist, dann versucht der bot herauszufinden, was mit diesem wort zu tun haben könnte. also versucht er ein möglichst eng verwandtes vokabular zu identifizieren. und wo sucht man besser, als an der quelle selbst?

google könnte zwar auch den eigenen index durchsuchen, allerdings schätzt man bei google die treffgenauigkeit wohl als besser ein, wenn man die seiteneigene suche nutzt. Diese ist nämlich aktueller, und liefert wohl auch mehr ergebnisse, als im google index zu finden sind.
__________________
Blag
ben ist offline  
Digg this Post!Add Post to del.icio.usBookmark Post in TechnoratiWong this Post!
Mit Zitat antworten
Alt 11.02.2008, 13:58   #27 (permalink)
Monika
WPD-Team
 
Benutzerbild von Monika
 
Registriert seit: 04.06.2005
Ort: INET
Beiträge: 5.880
Referrer-Spam von Google und Microsoft - SISTRIX Suchmaschinen Blog

google will so cloaking ausfindig machen, könnt logisch sein, aber bis dato machte dies meist nur msn

lg
Monika ist offline  
Digg this Post!Add Post to del.icio.usBookmark Post in TechnoratiWong this Post!
Mit Zitat antworten
Alt 11.02.2008, 15:25   #28 (permalink)
Alphawolf
WPD-Moderator
 
Registriert seit: 31.05.2005
Ort: Gera
Beiträge: 1.835
Vielleicht macht Google das, aber zumindest bei mir scheint das nicht der Fall zu sein, zumindest sagen das meine Logs. Ich werd Google mal anschreiben, vielleicht sagen die es mir ja.

"Ja, auf Ihrer Seite testen wir das seit geraumer Zeit, da wir so Ihren AdSense CTP-Wert in die Höhe treiben sollen.."
__________________
Erweiterungen

Geändert von Alphawolf (11.02.2008 um 15:27 Uhr).
Alphawolf ist offline  
Digg this Post!Add Post to del.icio.usBookmark Post in TechnoratiWong this Post!
Mit Zitat antworten
Alt 19.02.2008, 23:00   #29 (permalink)
alpha-centauri
PostRank: 3
 
Registriert seit: 19.01.2008
Beiträge: 105
Zitat:
Zitat von Monika Beitrag anzeigen
sperre dies per robots.txt aus, zumindest die Indexierung

das sind de facto keine Suchanfragen des google bots, sondern er sucht nach diesen Seiten weil die mal im Index gelandet sind und er sie wieder abgrasen mag...


Disallow: /?s*

lg
Gute Idee. Gleich bei mir eingestellt
alpha-centauri ist offline  
Digg this Post!Add Post to del.icio.usBookmark Post in TechnoratiWong this Post!
Mit Zitat antworten
Alt 10.03.2008, 09:51   #30 (permalink)
Alphawolf
WPD-Moderator
 
Registriert seit: 31.05.2005
Ort: Gera
Beiträge: 1.835
Eine weitere Möglichkeit ist dies hier: Google mit Suchfeldern in den Serps

Obwohl die Seite, um die es bei mir geht, nicht sonderlich groß ist (~ 500 Seiten), weshalb die für mich sicherlich kein solches Suchfeld vorsehen werden..
__________________
Erweiterungen
Alphawolf ist offline  
Digg this Post!Add Post to del.icio.usBookmark Post in TechnoratiWong this Post!
Mit Zitat antworten
Antwort


Themen-Optionen
Ansicht

Forumregeln
Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge anzufügen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

vB Code ist An.
Smileys sind An.
[IMG] Code ist Aus.
HTML-Code ist Aus.
Trackbacks are An
Pingbacks are Aus
Refbacks are Aus


Alle Zeitangaben in WEZ +2. Es ist jetzt 00:23 Uhr.


Sponsoren:

Powered by vBulletin® Version 3.6.8 (Deutsch)
Copyright ©2000 - 2008, Jelsoft Enterprises Ltd.
Content Relevant URLs by vBSEO 3.0.0  — ImpressumEin Inpsyde.com Projekt