Alain Aubert
Legendäres Mitglied
Es gibt Leute die der Meinung sind, dass Google technologisch massiv überlegen wäre. Das heisst, dass die Google Algorithmen einfach um Reihen besser sind, als die der Konkurrenz. Irgendwie kann man sich das bei der finanziellen Potenz von Microsoft schwer vorstellen. Yahoo ist auch nicht erst seit gestern im Markt... Und ob die Qualität der Suchresultate bei Google so viel besser sein soll...?
Z.B. im Spidering. Viele fragen sich, was der Sinn der beiden Googlebots ('mozilla' und 'der alte' eigentlich ist. Ich denke alle stimmen überein, dass mozilla gzip versteht und die Dokumente vorher vom alten besucht werden müssen, bevor sie auf dem Dokumentenserver landen (das Wunderland wo die SERPs wachsen). Ich persönlich bin der Meinung, dass der neue versucht die Strukturen zu erkennen. Das er versteht, was sinnlose Seiten und was Content innerhalb einer Präsenz ist. Z.B. hier im Forum gibt es sehr viele solcher sinnloser Seiten für Suchmaschinen und Gäste (PM-Seiten, Seiten mit erweiterten Angaben in der Url, etc). Mir ist schon relativ oft aufgefallen wie zielstrebig Google sich die Seiten herauspickt (vergleichsweise wenig sinnlose Seiten) während Inktomi (also Slurp) einfach alles frist.
Ich kann das nicht begründen, aber der Googlebot macht generell einfach einen intelligenteren Eindruck.
Dieser Gedanke ist mir gekommen, als mir zufälligerweise auffiel, wie oft der Msnbot eine Sinnlose Fehlerseite angepeilt hat, die im einen 301 gab.
grep fehler.*msnbot access_log_2005_w* -c
CODE access_log_2005_w10-0:100
access_log_2005_w11-0:101
access_log_2005_w12-0:123
access_log_2005_w13-0:88
access_log_2005_w14-0:123
access_log_2005_w15-0:106
access_log_2005_w16-0:112
access_log_2005_w17-0:131
access_log_2005_w18-0:98
access_log_2005_w19-0:93
access_log_2005_w20-0:89
access_log_2005_w21-0:245
access_log_2005_w3-0:963
access_log_2005_w4-0:1298
access_log_2005_w5-0:473
access_log_2005_w6-0:308
access_log_2005_w7-0:216
access_log_2005_w8-0:134
access_log_2005_w9-0:120
grep fehler.*googlebot access_log_2005_w* -c
CODE access_log_2005_w10-0:0
access_log_2005_w11-0:0
access_log_2005_w12-0:0
access_log_2005_w13-0:0
access_log_2005_w14-0:0
access_log_2005_w15-0:0
access_log_2005_w16-0:0
access_log_2005_w17-0:0
access_log_2005_w18-0:0
access_log_2005_w19-0:0
access_log_2005_w20-0:0
access_log_2005_w21-0:0
access_log_2005_w3-0:1
access_log_2005_w4-0:0
access_log_2005_w5-0:0
access_log_2005_w6-0:1
access_log_2005_w7-0:4
access_log_2005_w8-0:2
access_log_2005_w9-0:0
grep fehler.*slurp access_log_2005_w* -c
CODE access_log_2005_w10-0:768
access_log_2005_w11-0:780
access_log_2005_w12-0:791
access_log_2005_w13-0:899
access_log_2005_w14-0:524
access_log_2005_w15-0:962
access_log_2005_w16-0:720
access_log_2005_w17-0:992
access_log_2005_w18-0:904
access_log_2005_w19-0:592
access_log_2005_w20-0:584
access_log_2005_w21-0:522
access_log_2005_w3-0:180
access_log_2005_w4-0:542
access_log_2005_w5-0:329
access_log_2005_w6-0:469
access_log_2005_w7-0:648
access_log_2005_w8-0:578
access_log_2005_w9-0:873
Vielleicht ist ja doch was dran ;-)
PS Keine Repräsentativität, reiner Zufallsgriff,
Z.B. im Spidering. Viele fragen sich, was der Sinn der beiden Googlebots ('mozilla' und 'der alte' eigentlich ist. Ich denke alle stimmen überein, dass mozilla gzip versteht und die Dokumente vorher vom alten besucht werden müssen, bevor sie auf dem Dokumentenserver landen (das Wunderland wo die SERPs wachsen). Ich persönlich bin der Meinung, dass der neue versucht die Strukturen zu erkennen. Das er versteht, was sinnlose Seiten und was Content innerhalb einer Präsenz ist. Z.B. hier im Forum gibt es sehr viele solcher sinnloser Seiten für Suchmaschinen und Gäste (PM-Seiten, Seiten mit erweiterten Angaben in der Url, etc). Mir ist schon relativ oft aufgefallen wie zielstrebig Google sich die Seiten herauspickt (vergleichsweise wenig sinnlose Seiten) während Inktomi (also Slurp) einfach alles frist.
Ich kann das nicht begründen, aber der Googlebot macht generell einfach einen intelligenteren Eindruck.
Dieser Gedanke ist mir gekommen, als mir zufälligerweise auffiel, wie oft der Msnbot eine Sinnlose Fehlerseite angepeilt hat, die im einen 301 gab.
grep fehler.*msnbot access_log_2005_w* -c
CODE access_log_2005_w10-0:100
access_log_2005_w11-0:101
access_log_2005_w12-0:123
access_log_2005_w13-0:88
access_log_2005_w14-0:123
access_log_2005_w15-0:106
access_log_2005_w16-0:112
access_log_2005_w17-0:131
access_log_2005_w18-0:98
access_log_2005_w19-0:93
access_log_2005_w20-0:89
access_log_2005_w21-0:245
access_log_2005_w3-0:963
access_log_2005_w4-0:1298
access_log_2005_w5-0:473
access_log_2005_w6-0:308
access_log_2005_w7-0:216
access_log_2005_w8-0:134
access_log_2005_w9-0:120
grep fehler.*googlebot access_log_2005_w* -c
CODE access_log_2005_w10-0:0
access_log_2005_w11-0:0
access_log_2005_w12-0:0
access_log_2005_w13-0:0
access_log_2005_w14-0:0
access_log_2005_w15-0:0
access_log_2005_w16-0:0
access_log_2005_w17-0:0
access_log_2005_w18-0:0
access_log_2005_w19-0:0
access_log_2005_w20-0:0
access_log_2005_w21-0:0
access_log_2005_w3-0:1
access_log_2005_w4-0:0
access_log_2005_w5-0:0
access_log_2005_w6-0:1
access_log_2005_w7-0:4
access_log_2005_w8-0:2
access_log_2005_w9-0:0
grep fehler.*slurp access_log_2005_w* -c
CODE access_log_2005_w10-0:768
access_log_2005_w11-0:780
access_log_2005_w12-0:791
access_log_2005_w13-0:899
access_log_2005_w14-0:524
access_log_2005_w15-0:962
access_log_2005_w16-0:720
access_log_2005_w17-0:992
access_log_2005_w18-0:904
access_log_2005_w19-0:592
access_log_2005_w20-0:584
access_log_2005_w21-0:522
access_log_2005_w3-0:180
access_log_2005_w4-0:542
access_log_2005_w5-0:329
access_log_2005_w6-0:469
access_log_2005_w7-0:648
access_log_2005_w8-0:578
access_log_2005_w9-0:873
Vielleicht ist ja doch was dran ;-)
PS Keine Repräsentativität, reiner Zufallsgriff,