Google bot ermitteln.

Chris2130

Well-known member
ID: 308573
L
13 Januar 2008
527
24
Hi, wie kann ich eigentlich ermitteln ob gerade ein Google bot , yahoo bot usw auf meiner Seite ist?
 
IP angucken

"ob gerade ist" gibt es im WWW nicht. Du kannst nur gucken, wann jemand zuletzt da war. Das ist aber ein Zeitpunkt und keine Zeitspanne.
 
DU schaust ins logfile und guckst dir den useragenten an. Dann siehst du, wer wann deine Seite aufgerufen hat.

Willst du es dynamisch mit PHP herausfinden (wovon du nichts geschrieben hast), kannst du die Variable $_SERVER["HTTP_USER_AGENT"] nehmen.... wenn ich mich nicht irre.

Edit: Da war wohl jemand schneller ;-)
Naja... man könnte die Zeit zwischen Scriptausführung und HTML-Ausgabe schon als Zeitspanne bezeichnen, in der sich jemand auf der Seite befindet, oder? Also zumindest am ehesten :D
 
ja stimmt ^^ ist ein Zeitpunkt. Aber meine ja den Zeitpunkt. Nach was müsste ich denn dann den useragenten durchsuchen???
 
Der Useragent ist aber nicht 100%ig. Google mal auf Google :ugly: irgendwo stehen die IP-Adressen der Crawler. Nur damit kannst du dir sicher sein, dass es Google ist und sich nicht jemand nur als Google ausgibt.
 
...irgendwo stehen die IP-Adressen der Crawler. Nur damit kannst du dir sicher sein, dass es Google ist und sich nicht jemand nur als Google ausgibt.
Google gibt sich aber nicht immer als google aus, also kann es sein, dass auch mal ein "Kontrollaufruf" einer anderen IP mit z. B. Chrome kommt, Google Browser.

Es soll ja nicht sein, dass Webseiten bei Suchmaschinenbesuchen anders aussehen, als bei "Userbesuchen".
 
Der Useragent ist aber nicht 100%ig. Google mal auf Google :ugly: irgendwo stehen die IP-Adressen der Crawler. Nur damit kannst du dir sicher sein, dass es Google ist und sich nicht jemand nur als Google ausgibt.

Viel Spaß :ugly:

Die Frage ist natürlich wie immer, ob sich der ganze Aufwand wirklich lohnt. Manchmal ist eine nicht-100%ige Lösung auch schon ausreichend ;)

Greetz

paddya
 
Ja, ist zum Teil recht beliebt, weil es Webseiten gibt, die man ohne Google-Useragent nicht komplett sieht bzw. man sich dafür erst anmelden muss, mit Google-Useragent sieht man aber die ganze Seite :)
 
Darf man mal fragen, was das ganze für einen Sinn hat ?
Warum sollte man die Seite nicht für alle gleich machen ?
 
Weil du bestimmte Teile einer Plattform (Bsp.: Forum) nicht jedem zugänglich machen möchtest, beispielsweise eine Foto- / Videosektion oder einfach etwas was nicht jeder sehen muss.
Sperrst du jetzt aber unregistrierte Nutzer in deinem Forum aus, sperrst du logischerweise auch den GoogleBot aus, weil der auch nur den "Status" eines Unbekannten besitzt - und der kann dann logischerweise nur das crawlen, was er auch sieht. ;)
 
@dominicbauer

ein interessantes Paradoxon (naja nicht so ganz) :ugly:

Wenn ich etwas nur registrierten Benutzern zeigen will warum soll ich dann dennoch den google bot drauf lassen? Dann können es ja nicht registrierte Benutzer ergooglen :ugly:

mfg

Chris
 
Wenn man ein Forum hat und dort kann man nur die Beiträge sehen, wenn man registriert ist, man aber alles für den Googlebot zugänglich macht.
Was bringt einem das dann, denn wenn jetzt jemand googelt kann er die Beiträge doch sowieso nicht sehen und verschwindet gleich wieder von der Seite :-?

Ich hoffe ihr wisst was ich meine :mrgreen: