Schnüffler Alexa.com aussperren

PH

Legendäres Mitglied
Alexa.com schnüffelt Webseiten, Links, Kontaktdaten, Whois Daten und IP-Addressen aus.

Wenn ihr Shared Hosting betreibt, könnte euer Kunde (z.B. eine Gemeindekirche) auf Alexa.com irgendwann unter "other sites owned" die persönliche Seite von z.B. "Hobbyhure Gaby" entdecken.
Das kann passieren, wenn die IP Adresse übereinstimmt, und die Domain beim selben Registrar gemeldet ist.

Ich finde einen solche Verletzung des Geschäftsgeheimnisses des Hosters eine Frechheit, abgesehen davon, dass dies z.B. in einem Fall wie ich ihn oben geschildert habe, geschäftsschädigend sein kann.
Ausserdem sind die Daten oft einfach falsch (wie für Ayom, siehe unten), was das Ganze noch schlimmer macht.

Da hilft auch eine Anpassung der Kontaktdaten auf Alexa.com nichts.

Um zu vermeiden, dass Alexa.com eine Seite crawlt, sollte man folgendes in die robots.txt schrieben:

CODE User-agent: ia_archiver
Disallow: /


Wenn das nichts hilft, oder wenn es zu lange dauert (die sind nicht gerade sehr flink dort), könnte noch ein Mail an crawl@alexa.com helfen.

Wie waren eure Erfahrungen mit Alexa.com ?


P.S. Interessanterweise wird dort Ayom mit Seiten über Costa Rica und dortigen Hotels und Kaffeeproduzenten in Verbindung gebracht.

Und Ayom's Adresse ist

Ayom.com
Pob 25
Los Angeles, CA
90019

haha - was für ein Mist. Dürfen die so einen Quatsch einfach veröffentlichen?

 
Hmm,

wenn ich mich über eine Site informieren möchte sehe ich selbstverständlich auch bei Alexa nach. Wenn ich dort nichts finde, finde ich das eher suspekt. Außerdem hatte ich immer den Verdacht, dass Alexa sowieso nur von Leuten benutzt wird, die sich mit dem Internet auskennen; sich also auch nicht darüber wundern würden, wenn eine Rotlichtseite mit der gleichen IP gehostet wie ein anderer Service wird. Natürlich ist das aber ein weiteres Indiz, dass der Service eher klein ist; denn sonst würde er tendenziell eher auf einem System mit eigener IP liegen.

Ich hab andererseits noch nie genau über Alexa nachgedacht; vielleicht ändere ich meine Einstellung zu solchen Datenkraken ja auch irgendwann. Für den Moment find ich das allerdings eher sinnvoll, als schädlich.

Viele Grüße

Martin
 
Ebenfalls würde ich den AboutUs-Bot aussperren. Dieses Bot sammelt Daten und stellt große Teile von Webseiten in das "AboutUs"-Wiki, so eine Art Webkatalog. Leider nimmt der Bot auch allerlei Daten (z.B. Whois-Daten) in die Seite auf.
http://www.aboutus.org/AboutUsBot
CODE User-agent: AboutUsBot
Disallow: /
 
QUOTE Um zu vermeiden, dass Alexa.com eine Seite crawlt, sollte man folgendes in die robots.txt schrieben:

CODE
User-agent: ia_archiver
Disallow: /


Wenn das nichts hilft, oder wenn es zu lange dauert (die sind nicht gerade sehr flink dort), könnte noch ein Mail an crawl@alexa.com helfen.


Ich habe das in jeder robots.txt drinstehen, trotzdem kennt mich Alexa.

Und denk mal darüber nach was Google alles protokoliert durch den fleissigen Einsatz von Adsense, Analytics, Sitemap, ....


QUOTE wenn ich mich über eine Site informieren möchte sehe ich selbstverständlich auch bei Alexa nach. Wenn ich dort nichts finde, finde ich das eher suspekt.


Was erwartest du dort zu finden? Das Impressum? Ich finde es nicht suspekt wenn ich dort nichts finden würde.


QUOTE Außerdem hatte ich immer den Verdacht, dass Alexa sowieso nur von Leuten benutzt wird, die sich mit dem Internet auskennen;


Das denke ich auch. Ich glaub, wenn ich kein Webmaster wäre, dann würde Alexa vermutlich gar nicht kennen. Außerhalb von Webmaster-Kreisen habe ich über Alexa noch nie etwas gelesen.

 
Auch ich habe alexa ausgesperrt. Wenn Ihr Alexa aussperrt, seid Ihr auch bei archive.org draussen.
 
Danke für die Info!
Habe Alexa jetzt auch ausgesperrt.
Mir war Alexa schon im August, als ich das erste mal von ihr gecrawlt wurde, nicht geheuer!

Grüße
k3v
 
Ich halte auch nichts von Alexa, aber lasse den mal drin.
Alleine die Besucherzahlen stimmen schon gar nicht... z.B: habe ich viel mehr CH Besucher auf CH Seiten und nicht so wie Alexa behauptet, viel mehr Deutsche.

Gruss Marc
 
Soweit ich gehört habe basiert Alexas Auswertung einzig und allein auf der Alexa Toolbar sie sendet die Surfgewohnheiten eines User an Alexa. Das heisst sie haben nur Angaben zu Benutzern die diese Toolbar installiert haben. (Ich weiss nicht wie viel User das sind.) Aber irgendwie grenzt das ganze schon an Spyware. Die Software TuneUp hat sogar einen eigen Menupunkt nur um Alexa auszusperren.

Also mir ist das ganze suspekt, mit seriöstät hat das wenig zu tun.
Nur möchte ich zu den oben genannten Punkte bezüglich Share Host und IP sagen, dass sind Daten die öffentlich zugänglich sind. Als Insitution sollte man halt schauen, bei einem Hoster unterzukommen der erotische Inhalte verbietet.

Grüsse
Driver Anhang anzeigen 2

 
QUOTE
OT:
alex kann jetzt anscheinen auch die %tuale länderherkunft der besucher anzeigen:

ayom.com:
Germany-75.4%
Switzerland-18.4%
Austria-1.7%
Italy-1.3%
United States-1.0%



Gut aber diese Daten sind eh Mist. Wenn du damit rechnest, dass 0,1% aller Nutzer die Alexa-Toolbar installiert haben und eine Website im Monat 10'000 Besucher hat, haben gerade mal 10 die Alexa-Toolbar installiert. Die statistische Fehlerquote ist vor allem bei kleineren und mittleren Websites *sehr gross*.
 
QUOTE
alex kann jetzt anscheinen auch die %tuale länderherkunft der besucher anzeigen:



PS: Noch ein Beispiel von meiner Website...
Alexa meint:
Switzerland 35.8%
Austria 13.2%
Italy 7.5%
Germany 7.5%
Poland 5.7%

Realität:
Germany 25.09%
Austria 21.85%
Denmark 13.07%
Poland 4.38%
Switzerland 3.53%

Und das bei 1500 Besuchern täglich... Wie gesagt, die Fehlerquote ist *viel zu hoch*...
 
QUOTE Als Insitution sollte man halt schauen, bei einem Hoster unterzukommen der erotische Inhalte verbietet.


Das ist kaum realistisch, denn die meisten grossen Hoster beherbergen auch Adult-Seiten. Es kommt auch nicht so sehr auf den Hoster an, sondern auf die gebuchten IP-Addressen.

Ausserdem veröffentlicht Alexa falsche Daten, wie wir im Falle von Ayom sehen. Anstelle der Südamerikanischen Kaffeerösterei könnte es ja auch eine Sexseite sein, die unter "other sites owned" gelistet wird?
 
Dann wird es mal Zeit für einen Hoster für brave Seiten inkl. grünen Gewissen (so à la für jeden kW Strom wird in Afrika 5 Euro in ein Solarprojekt investiert etc, adult seiten sind ausgeschlossen und nur wer nachweislich Seiten mit hohen moralischen Anforderungen hat darf beim Hoster Kunde werden)
wink.gif



Nicht, dass jetzt der Verdacht aufkommt ich verteidige Alexa. Denn ihre Angaben sind offensichtlich falsch. Doch trozdem sind Daten wie Whois und IP adresse öffentlich. Dass heisst wenn du deine Seite bei irgendeinem Hoster hast musst du halt damit rechnen, dass man rausfinden kann wer sonst noch auf dem Server ist. (Das ist wie wenn du bei einem Mehrfamilienhaus schauen gehst wer ausser dem Pfarreisekritariat noch im Haus eingemietet ist (z.b. Massagesalons etc)). Ich muss sagen wenn ich ein Kirche wäre, würde ich mich auch nicht wohl fühlen wenn meine Webseite auf dem gleichen Server wie die eines Spezialdienstleisters liegt. (Wobei wir wieder beim Notwenidgkeit eines "braven und guten" Hosters wären...)

Grüsse
Driver
 
QUOTE (driver @ Mo 19.2.2007, 13:10) Dass heisst wenn du deine Seite bei irgendeinem Hoster hast musst du halt damit rechnen, dass man rausfinden kann wer sonst noch auf dem Server ist.

Nur interessiert dies den Standartinternetuser meist nicht (Meine Erfahrung).

Gruss Marc
 
QUOTE (ms @ Mo 19.02.2007, 14:33)
QUOTE (driver @ Mo 19.2.2007, 13:10) Dass heisst wenn du deine Seite bei irgendeinem Hoster hast musst du halt damit rechnen, dass man rausfinden kann wer sonst noch auf dem Server ist.

Nur interessiert dies den Standartinternetuser meist nicht (Meine Erfahrung).

Gruss Marc

Das Interessiert mich auch nicht ich kenne nicht mal die IP meiner Pages nur bei Analytics, werden 2 - 3 Gelistet mit meist 1-3 zugriffen im Monat, ich hatte mich schon gefragt was das für adressen sind
 
Zurück
Oben