Suchdienste: Unterschied zwischen den Versionen

Aus IV1
Robert (Diskussion | Beiträge)
Robert (Diskussion | Beiträge)
Zeile 23: Zeile 23:


[[Datei:Bild_Webkatalog.jpg]]
[[Datei:Bild_Webkatalog.jpg]]
''Abb. 2.2.1.1: Aufbau von Webkatalogen (Quelle: Griesbaum, J / Bekavac, B. / Rittberger, M., 2009, Typologie der Suchdienste im Internet, S. 19)''
''Abb. 2.2.1.1: Aufbau von Webkatalogen (Quelle: Griesbaum, J / Bekavac, B. / Rittberger, M., 2009, Typologie der Suchdienste im Internet, S. 19)''



Version vom 31. August 2009, 13:25 Uhr

Oftmals wird der Begriff Suchmaschinen ungenau eingesetzt, nämlich für alle Arten von Suchwerkzeugen bzw. Internetsuchdiensten. Viele Nutzer verwenden sehr schnell die überall bekannte Suchmaschine Google und vergessen allzu leicht, dass es eine Fülle an guten Internetsuchdiensten für die effiziente Suche im Internet gibt. Es gibt keine Suchmaschine, die für jede Fragestellung eine optimale Antwort geben kann - auch Google, die mit Abstand größte und erfolgreichste Suchmaschine der Welt, nicht.

Der erste Abschnitt erklärt die wichtigsten Suchdienste und sollte Entscheidungshilfe sein, was Sie über dieses Suchwerkzeug überhaupt finden können - und vor allem, was Sie nicht finden können. Wie man das passende Suchwerkzeug für die jeweilige Aufgabenstellung bzw. die Suchstrategie festlegt, ist dann die zweite Fragestellung.



Welche Suchdienste gibt es?

Internetsuchdienste können nach verschiedenen Kriterien differenziert werden. Grundlegend unterscheidet man, ob es sich um ein rein maschinelles System (daher der Name „Suchmaschine“), d. h. algorithmenbasiertes automatisches System handelt oder um eine manuell (von Menschen) erstellte Dokumentsammlungen (Verzeichnisse, Kataloge) auf der anderen Seite. Weiters unterscheiden wir, ob es sich um einen Universalsuchdienst oder einen Spezialsuchdienst handelt.

Manuell aufgebaute Link-Sammlungen waren der Beginn bei den Suchdiensten im WWW. Wir werden daher vorerst Linksammlungen/Internetverzeichnisse in umfangreicher Form auch Webkatalog genannt sowie Social Bookmarkdienste für manuell, d.h. von Menschen erstellte Systeme erläutern. Große roboterbasierte Suchmaschinen und Meta, suchmaschinen für rein maschinelle Systeme behandeln wir in der Folge. Spezialsuchmaschinen gibt es für viele Anwendungsbereiche, sie sind besonders interessante Suchdienste und teilweise wenig bekannt.

Manuell aufgebaute Link-Sammlungen waren der Beginn bei den Suchdiensten im WWW. Wir werden daher vorerst Linksammlungen/Internetverzeichnisse (in hierarchisch strukturierter Form auch Webkatalog genannt) sowie Social Bookmarkdienste für manuell erstellte Suchdienste erläutern. Große roboterbasierte Suchmaschinen und Metasuchmaschinen für rein maschinelle Systeme werden anschließend behandelt. Spezialsuchmaschinen gibt es für viele Anwendungsbereiche, sie sind, obwohl besonders interessant, eher wenig bekannt. Nachschlagewerke, Fachdatenbanken und Bibliothekskataloge sind weitere Suchdienste, im engeren Sinn aber keine Suchmaschinen. Große Bereiche des Internet werden von Datenbanken abgedeckt, die mit einer allgemeinen Suchmaschine nicht erreichbar sind. („Deep Web“, „Invisible Web“) Es handelt sich hierbei in erster Linie um themenspezifische Datenbanken, die erst über Anfragen dynamische Webseiten generieren. Die Anfragen können über das Web gestellt werden, die Seiten werden aber von den Suchmaschinen nicht indiziert. Der größte Teil des „Deep Web“ ist kostenfrei zugänglich, es gibt aber auch eine Reihe von kostenpflichtigen Suchdiensten und Hosts. Man schätzt, dass das „Invisible Web“ für den Wissenschaftsbereich eine Größe von zwischen 20 und 100 Milliarden Dokumenten ausmacht. [1]

Linksammlungen / Internetverzeichnisse, Webkataloge

Schon frühzeitig sammelte man Adressen von Webseiten im WWW in einem Internetverzeichnis. In einfachster Form entstand eine Linkliste. In einem Internetverzeichnis werden die Internetseiten von Menschen aufbereitet. Eine Person oder ein ganzes Redaktionsteam wählt Internetseiten aus. Dabei wird die Internetseite meist einer Prüfung unterzogen. Nach bestandener Qualitätsprüfung wird die Seite im Internetverzeichnis unter einem oder mehreren Themengebieten gespeichert. Bei sehr umfangreichen Verzeichnissen hat sich eine hierarchische Gliederung der Themengebiete bewährt, man spricht dann von einem Webkatalog. Der älteste und sehr umfangreiche Webkatalog ist die Virtual Library. (siehe http://vlib.org/). In manchen Verzeichnissen werden die Internetseiten auch bewertet, besonders "gute" Seiten werden z. B. mit einem Sternchen oder einer Lesebrille gekennzeichnet.

Folgende Graphik illustriert den konzeptionellen Aufbau von Webkatalogen.

Abb. 2.2.1.1: Aufbau von Webkatalogen (Quelle: Griesbaum, J / Bekavac, B. / Rittberger, M., 2009, Typologie der Suchdienste im Internet, S. 19)

Berühmt ist das Open Directory Project mit dem dmoz-Verzeichnis. (siehe http://dmoz.org/) Es handelt sich dabei um den größten Webkatalog, den es derzeit im WWW gibt. „Im Juni 2009 verzeichnete das ODP über 4,5 Millionen Einträge – über 500.000 davon im deutschsprachigen Teil des Katalogs. Diese sind in über 700.000 Kategorien sortiert. Seit der Gründung des Projektes haben mehr als 80.000 Editoren zum Wachstum des Verzeichnisses beigetragen.“[2] Der Inhalt des Google Verzeichnis entspricht dem dmoz-Verzeichnis und ist mit der Page-Rank-Technologie von Google erweitert worden. Im deutsch¬sprachigen Teil des dmoz-Verzeichnis (http://www.dmoz.org/World/Deutsch/) findet man 16 Hauptkategorien (z.B. Computer, Wirtschaft, Internet, Gesellschaft, Wissenschaft, Kultur, Wissenschaft, usw.) In der Hauptkategorie (z.B. "Internet"), Unterkategorien (z.B. "Suchen") findet man die weitere Unterkategorie (z.B. "Verzeichnisse") sowie Querverweise auf ähnliche Themengebiete (z.B. "Wissen") sowie weitere Unterkategorien (z.B. Open Directory Project). Um nun eine Seite in einem Internetverzeichnis zu finden, können Sie sich entweder von einer Hauptkategorie bis zu einem Themengebiet durchklicken (das sogenannte Browsing) oder das Internetverzeichnis über eine eingebaute Suchmaschine durchsuchen. Es existieren große Webkataloge, die versuchen, das ganze WWW abzudecken. Daneben gibt es viele spezialisierte Kataloge, die sich auf ein Land, z.B. Deutschland oder mehrere Themen beschränken. (http://www.music.de bietet z.B. nur Links zur Musikszene in Deutschland). Die spezialisierten Kataloge werden wir im Kapitel Spezialisierte Suchdienste noch näher erläutern. Gute internationale Beispiele für Kataloge sind

Ein guter deutscher Webkatalog:

Besondere Beispiele für von Bibliotheken gepflegte Kataloge mit qualitativ hochwertigen Inhalten:

Die manuelle Auswahl ist aufwendiger und nimmt mehr Zeit in Anspruch als die automatische Indexierung in Suchmaschinen, daher sind diese Verzeichnisse auch viel kleiner als die Indexe der Suchmaschinen. Wenn das größte Verzeichnis etwa 4,5 Millionen Internetseiten umfasst, ist es von der Anzahl der Links im Vergleich zu einer großen Suchmaschine um mindestens den Faktor 10.000 kleiner. Meist sind Internetverzeichnisse jedoch noch deutlich kleiner und bestehen nur aus wenigen tausend ausgewählten Internetseiten. Allerdings können Sie in einem Internetverzeichnis auch Adressen finden, die von Suchmaschinen - technisch bedingt - nicht gefunden werden können. Da es sich in der Regel um bewertete Information handelt, ist die Qualität der Information höher.

Zusammenfassend sollen wesentliche Vor- und Nachteile von Internetverzeichnissen erläutert werden: Vorteile: [3]

  • Webkataloge eignen sich sehr gut für den Einstieg in bestimmte Themen und geben einen ersten Überblick in das Thema.
  • Die redaktionelle Aufarbeitung, sichert eine minimale Qualität der ausgewählten Webinhalte.
  • Die Einteilung erfolgt durch thematische und hierarchische Prinzipien. Dadurch bieten Webkataloge Kontextinformationen.
  • Oftmals erfassen Webkataloge eine Vielzahl von hochwertigen (Fach-)Datenbanken, deren Inhalte Suchmaschinen verschlossen bleiben.

Nachteile:

  • Bei Webkatalogen fehlt oft ein standardisiertes Regelwerk für die Einordnung. Der hierarchische Aufbau ist von Webkatalog zu Webkatalog unterschiedlich.
  • Die Katalogpflege ist sehr aufwendig, vor allem um die Inhalte zu erschließen und jeweils zu aktualisieren.
  • Webkataloge decken nur einen Bruchteil des gesamten Webs ab.

Social Bookmarkdienste oder Tagging Communities

Mit dem Entwicklungstrend Web 2.0 wurden Social Bookmarkdienste populär. Social Bookmarks sind Lesezeichen, die in einem Netz mit Hilfe einer Browser-Oberfläche von verschiedenen Benutzern gemeinschaftlich erschlossen werden. Sogenannte Social-Bookmarkdienste wurden für das Sammeln von Links geschaffen. Bekannte Beispiele im internationalen Raum sind Del.icio.us, im deutschsprachigen Raum Mister Wong. Im Gegensatz zu einem Webkatalog geschieht das gemeinsame Indexieren der Links ohne strukturelle oder inhaltliche Vorgaben und Kontrolle. Das heißt, es existiert keine Ordnungshierarchie. Die Webseiten werden mit freien Schlagworten, so genannten Tags versehen, welche gesammelt eine folksonomy bilden. Eine Tag-Cloud ist dann eine Visualisierung mehrerer Tags. Kommentierte Bookmarks, die frei verschlagwortet wurden können dann anderen Benutzern zugänglich gemacht werden.

Folgende Graphik zeigt die Funktionsweise der Social Bookmarkdienste.

Abb. 2.2.1.2: Aufbau von Social Bookmarkdienste (Quelle: Griesbaum, J / Bekavac, B. / Rittberger, M., 2009, Typologie der Suchdienste im Internet, S.25)

Überschrift 2

Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet.[4]

Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit, sed diam nonummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat volutpat.

Literatur

Quellen

  1. Dirk Lewandowski and Philipp Mayr, Exploring the Academic Invisible Web, in: Library Hi Tech, 2006, Volume 24, Issue 4, S. 529 – 539
  2. http://de.wikipedia.org/wiki/Open_Directory_Project (7.8.2009)
  3. http://sprint.informationswissenschaft.ch/suche-im-internet/suchverfahren-im-internet/katalog-verzeichnis/ (10.8.2009)
  4. http://www.idv.edu/


Weiterführende Links