Für und Wider von Stemming/Synonymen in der Suche

Alain Aubert

Legendäres Mitglied
Google/MSN/Yahoo versuchen ja mit Stemming den User und den Text besser zu verstehen.

Noch mehr Verständnis kann erzeugt werden, wenn der Computer, der den Bibliothekar spielt, auch weiss, welche Wörter denn zu welchen synonym sind. Und was Abkürzungen von was ist. Letzeres kann man primitiv als Synonym verstanden werden.

Wenn ich in Google nach [doh] suche, dann liefert mir das mittlerweile unglaublich intelligente Google international 8 von 10 Resultate von Departement of Health Seiten (Gesundheitsministerien). Wow, respekt Google. Die Suche in deutschen Resultaten findet dann nicht weniger beeindrucken die Seite der "Doping Hilfe Opfer", ebenfalls abgekürzt mit doh.

Aber... ihr kennt sicher alle Homer. Auf deutsch sagt er immer 'Neiin' Und auf englisch eben doh!... Eigentlich hab ich das gesucht http://www.google.de/search?hl=de&q=doh&bt...ta=lr%3Dlang_de

Wirklich 100% wissen, was ich will, wenn ich etwas eingebe, werden sie halt nie wissen...

Nein im Ernst, die Funktion ist nicht auf den Kopf gefallen, ironischerweise liefert [doe] nicht nur nicht die Erkennung von den Erziehungsminsterien, sondern auch noch das Energieministerium mit zusätzlichen Links. Enron-Demokratie auch im Web. Aber Dos z.B. highlighted auch "Denial of Service", was für den Nutzer eigentlich ne gute Sache ist. Wer such schon nach doh!
 
QUOTE Noch mehr Verständnis kann erzeugt werden, wenn der Computer, der den Bibliothekar spielt, auch weiss, welche Wörter denn zu welchen synonym sind. Und was Abkürzungen von was ist. Letzeres kann man primitiv als Synonym verstanden werden.


Einmal ganz auf den Kopf gefallen gefragt:
Ist es eigentlich offensichtlich, dass da überhaupt eine Synonymerkennung eine Zuordnung "doh" entspricht "Department of Health" zuschlägt?

Das Suchwort selber (doh) kommt doch oft genug vor, so dass ich erst mal vermuten würde, dass das Vorkommen von diesem für das Ranking verantwortlich ist.
 
QUOTE Das Suchwort selber (doh) kommt doch oft genug vor, so dass ich erst mal vermuten würde, dass das Vorkommen von diesem für das Ranking verantwortlich ist.


Und vermutlich auch von eingehenden Links mit den Text "DOH".
 
Es geht um das Markieren. Es stellt sich für mich die Frage, ob man alle 3 Wörter in den Snipplets markiert die sich wie die Suche abkürzen lassen, oder ob man ein Wörterbuch besitzt. Ich würde zweiteres wählen. Dieses Wörterbuch eben, ist was aus "kulturellen Kontext" hervorgehen sollte.
 
Zurück
Oben