Neuer Trend: Tagging – mit Vor- und Nachteilen
Ein gravierender Nachteil im Web liegt darin, dass die meisten Inhalte nicht über Schlüsselworte, sondern nur Suchbegriffe erschlossen werden können. Der Unterschied ist subtil, aber entscheidend: Bei Suchbegriffen kommt es darauf an, dass exakt die gesuchte Schreibweise verwendet wurde … und die lässt sich häufig nur erraten.
Kleines Beispiel: Stellen Sie sich vor, Sie suchen nach einer Ferienunterkunft im Hamburger Umland – wonach suchen Sie? „Hotel“? „Pension“? „Bed and Breakfast“? „Unterkunft“? Gar nicht so einfach, nicht wahr? Auch Webkataloge (als Gegenpart der Suchmaschinen) helfen nur bedingt weiter, da sie eine thematische Einordnung nur auf der obersten Ebene – also der Website selbst – nicht aber für einzelne Beiträge vorsehen. Wie also einzelne Nachrichten sinnvoll einordnen?
Verschlagwortung als Vorbild
Die systematische Verschlagwortung von Inhalten mit immer gleichen Schlüsselworten schafft hier Abhilfe – aber nur bei geschlossenen Systemen und entsprechender Disziplin sowie hohem Aufwand hinsichtlich der manuellen Verschlagwortung. Die automatische Verschlagwortung auf der anderen Seite steckt noch immer in den Kinderschuhen und ist nur dann erfolgreich, wenn die Dokumente und zu verschlagwortenden Beiträgen einem fest umrissenen Themengebiet zuzuordnen sind. Das ist aber im Web häufig nicht der Fall.
Nun aber hat dieses Prinzip das „öffentliche“ Internet erreicht – und hier insbesondere die Weblogs. Verschiedene Aggregatoren ermöglichen ihren Nutzern eine manuelle Verschlagwortung von (fremden) Beiträgen, während Blogging-Software zunehmend Unterstützung anbietet, um eigene Beiträge zu verschlagworten. Und natürlich spricht man nicht von Verschlagwortung, sondern von Tagging.
Tagging als Modetrend
Dabei können dann die Nutzer von Aggregatoren wie Del.icio.us („social bookmarks“) oder Technorati, aber neuerdings auch Besucher beispielsweise von Blogg.de überprüfen, welche Beiträge zu den sie interessierenden Tags neu veröffentlich wurden. Und auch Dienste wie Flickr setzen auf Tagging und erlauben es den Nutzern, Fotos zu verschlagworten.
Mehr noch: per RSS-Reader kann man spezielle Feeds zu den Tags abonnieren, die einen interessieren … und so bleibt man zu diesem Thema ständig auf dem Laufenden! Und für CMS wie Expression Engine gibt es Erweiterungen, mit denen lokal Tags in die Beiträge eingebaut werden, die auch von Technorati übernommen werden können. Damit rückt das semantische Web ein Stückchen näher – zumindest in der Theorie.
Prinzipiell unterscheidet man drei Varianten:
- Die Tags werden von den Autoren der Beiträge festgelegt.
Vorteil: Diese kennen ihren Beitrag und das thematische Umfeld am Besten, so dass die geeignetsten Tags verwendet werden können.
Nachteil: Ein Beitrag kann auch unter anderen Tags für die Leser interessant sein oder die Leser finden die Tags-Auswahl unzutreffend. - Die Tags werden den Beiträgen von den Lesern zugeordnet.
Vorteil: In der Regel hat der Leser kein wirtschaftliches Interesse an der Tag-Zuordnung. Die zugeordneten Tags sind so „objektiver“.
Nachteil: Ohne Anreizsystem werden neue Beiträge nur langsam mit Tags versehen. Eventuell läuft die Zuordnung den Interessen des Autors zuwider. - Kombinationen, bei denen Zuordnungen von Tags durch die Community angepasst und erweitert werden können.
Probleme im Detail
In der Praxis wirft das Tagging jedoch Probleme auf. Das Gravierendste: Niemand gibt vor, wie die Tags zu lauten haben. So findet man in einem einzigen System für Beiträge zu Expression Engine unter anderem die Tags „EE“, „Expression Engine“ und „expressionengine“ –
tatsächlich wird man also nur einen Bruchteil der Informationen finden, wenn man nur einen Tag-Channel oder RSS-Feed beobachtet. Mittlerweile nutzen einige Autoren sogar alle drei Tags parallel für jeden ihrer Beiträge. Aber wenn man das Szenario weiter denkt, kann dies auch keine Lösung sein.
Tags erobern das Web unmerklich
Übrigens: Auch „social networking“-Software wie die openBC-Plattform setzt auf Tagging. Auch wenn es weniger auffällt. Hier werden alle Begriffe, die der Nutzer in seinem Profil verwendet, als Tags ausgewertet und so zu Suchbegriffen, die Gleichgesinnte auffinden helfen sollen. Und auch hier zeigt sich, dass die „demokratische“ Verwendung von Tags und die fehlende Säuberung durch das System die Tags oft unbrauchbar machen.
Das fängt schon bei der Angabe der besuchten Hochschule oder des Arbeitgebers an: „Universität Kaiserslautern“, „TU Kaiserslautern“, „TU KL“, „Uni KL“ und anderes mehr sind alles gültige Angaben, die das Gleiche bezeichnen, aber zu ganz unterschiedlichen Suchergebnissen führen. Nicht einmal die Mitarbeiter ein und desselben Unternehmens finden sich so, wenn verschiedene Schreibweisen für die Unternehmensbezeichnung verwendet werden.
Fehlende Kontrollinstanz
Würde die Systeme Vorschläge für ähnlich-lautende Tags unterbreiten, könnte das dem Tag-Wildwuchs zwar ein wenig entgegen wirken, aber wirklich optimal können frei gewählte Tags nie funktionieren. Im Rahmen einer verschlagwortung von Unternehmensdokumenten haben wir mal nicht nur einen Verschlagwortungskatalog entwickelt, sondern auch ein umfangreiches Regelwerk, wie Schlagworte zu bilden sind und welche Genehmigungsprozesse einzuhalten sind, damit ein neues Schlagwort aufgenommen wird (was in der Theorie Auswirkungen auf alle bisherigen Verschlagwortungen haben konnte). Für ein freiwilliges manuelles Tagging sind solche Vorgaben natürlich ungeeignet.
Auch die automatische interne Zusammenfassung von Tags, indem die Groß-/Kleinschreibung und Leerzeichen in den Tags entfernt werden, löst das Problem nicht wirklich, wie unser obiges Beispiel verdeutlicht.
Noch problematischer: Wenn es keine Kontrollinstanz gibt, können Tags auch missbraucht werden. Es ist nicht festgelegt, welche und wieviele Tags für einen Beitrag erlaubt sind – so kann ein Autor seinen Beitrag mit zahllosen nutzlosen Tags versehen, nur um Besucher anzulocken. Tag-Spamming könnte daher zum nächsten ernstzunehmenden Problem werden. Zumindest solange Autoren selbst festlegen können, unter welchen Tags ihre Beiträge geführt werden. Leider verschiebt sich das Problem auch dann nur, wenn ncht die Autoren sondern die Leser über die Tags entscheiden. Hier könnte z.B. ein Konkurrent mutwillig der Wettbewerber manipulieren.
In die gleiche Kerbe schlägt auch Monika Henzinger, seit 1999 Forschungsdirektorin bei Google. In einem FAZ-Interview gab sie als Hauptgrund, warum das semantische Netz nicht funktionieren kann und Suchmaschinen keine semantischen, sondern nur syntaktische Treffer liefern können, Spamming und so genannte „Suchmaschinen-Optimierer“ an. Die gelieferten Meta-Informationen (ähnlich den hier vorgestellten Tags) können nicht automatisiert auf Korrektheit und Vollständigkeit überprüft werden:
[…] Einer großen Zukunftsvision, dem sogenannten semantischen Internet, gibt Henzinger aber keine große Chance. Für das semantische Internet müssen die Betreiber ihren Websites versteckte Informationen zufügen, in denen die Themen der Seite genauer festgelegt sind. „Wegen der Spammer wird es das semantische Internet nicht geben“, sagt Henzinger voraus. Suchmaschinen-Spammer machen sich die Arbeitsweise der Suchalgorithmen zunutze, damit ihre Internetseiten möglichst weit oben in der Trefferliste erscheinen. Da in der Regel nur diese ersten Suchtreffer angeklickt werden, hat sich inzwischen eine ganze Industrie darauf spezialisiert, Internetseiten für Suchmaschinen zu „optimieren“ – zu Lasten aller anderen Internetnutzer. „Wegen des Spams können wir nur den Worten trauen, die wirklich auf einer Internetseite erscheinen. Die Idee des semantischen Webs ist ja gerade, eine Seite mit semantischen Informationen anzureichern, die die Benutzer nicht sehen können“.
[…] Überhaupt sei der Kampf gegen Suchmaschinen-Spam sehr ärgerlich: „Ich finde es sehr schade, daß diese Egoisten die Suchergebnisse zu ihrem Vorteil manipulieren und damit die Suchergebnisse für alle anderen Nutzer schlechter machen. Alle Suchmaschinen würden viel besser funktionieren, wenn es keinen Spam gebe“, klagt Henzinger. […]
So bleibt Tagging ein nettes Spielzeug, das in Kombination mit automatischer Suche und Verlinkung zu mehr Komfort bei bestimmten Anwendungen führen kann. Aber denken und suchen wird man auch in Zukunft selbst müssen. Und wenn man sich die Diskussionen um die Autolink-Funktionen der neuen Google Toolbar 3 (beta) anschaut, die u.a. Adressen und ISBN-Nummern auf Webseiten automatisch mit Links zu weiterführenden Informationen verknüpft, so sieht man, dass Tagging nicht immer gewünscht wird. Den ultimativen Supergau aber skizzierte kürzlich Sven Lenartz im Dr. Web Weblog: Ein Autotagging, dass alle Begriffe auf Webseiten automatisch zu den passenden eBay-Auktionen verlinkt.