Suchdienste: Unterschied zwischen den Versionen

Aus IV1
Robert (Diskussion | Beiträge)
Keine Bearbeitungszusammenfassung
Robert (Diskussion | Beiträge)
Zeile 19: Zeile 19:


Schon frühzeitig sammelte man Adressen von Webseiten im WWW in einem Internetverzeichnis. In einfachster Form entstand eine Linkliste. In einem Internetverzeichnis werden die Internetseiten von Menschen aufbereitet. Eine Person oder ein ganzes Redaktionsteam wählt Internetseiten aus. Dabei wird die Internetseite meist einer Prüfung unterzogen. Nach bestandener Qualitätsprüfung wird die Seite im Internetverzeichnis unter einem oder mehreren Themengebieten gespeichert. Bei sehr umfangreichen Verzeichnissen hat sich eine hierarchische Gliederung der Themengebiete bewährt, man spricht dann von einem Webkatalog. Der älteste und sehr umfangreiche Webkatalog ist die Virtual Library. (siehe http://vlib.org/). In manchen Verzeichnissen werden die Internetseiten auch bewertet, besonders "gute" Seiten werden z. B. mit einem Sternchen oder einer Lesebrille gekennzeichnet.
Schon frühzeitig sammelte man Adressen von Webseiten im WWW in einem Internetverzeichnis. In einfachster Form entstand eine Linkliste. In einem Internetverzeichnis werden die Internetseiten von Menschen aufbereitet. Eine Person oder ein ganzes Redaktionsteam wählt Internetseiten aus. Dabei wird die Internetseite meist einer Prüfung unterzogen. Nach bestandener Qualitätsprüfung wird die Seite im Internetverzeichnis unter einem oder mehreren Themengebieten gespeichert. Bei sehr umfangreichen Verzeichnissen hat sich eine hierarchische Gliederung der Themengebiete bewährt, man spricht dann von einem Webkatalog. Der älteste und sehr umfangreiche Webkatalog ist die Virtual Library. (siehe http://vlib.org/). In manchen Verzeichnissen werden die Internetseiten auch bewertet, besonders "gute" Seiten werden z. B. mit einem Sternchen oder einer Lesebrille gekennzeichnet.
Berühmt ist das Open Directory Project mit dem dmoz-Verzeichnis. (siehe http://dmoz.org/) Es handelt sich dabei um den größten Webkatalog, den es derzeit im WWW gibt. „Im Juni 2009 verzeichnete das ODP über 4,5 Millionen Einträge – über 500.000 davon im deutschsprachigen Teil des Katalogs. Diese sind in über 700.000 Kategorien sortiert. Seit der Gründung des Projektes haben mehr als 80.000 Editoren zum Wachstum des Verzeichnisses beigetragen.“<ref> http://de.wikipedia.org/wiki/Open_Directory_Project (7.8.2009)</ref>  Der Inhalt des Google Verzeichnis entspricht dem dmoz-Verzeichnis und ist mit der Page-Rank-Technologie von Google erweitert worden. Im deutsch¬sprachigen Teil des dmoz-Verzeichnis (http://www.dmoz.org/World/Deutsch/) findet man 16  Hauptkategorien  (z.B. Computer, Wirtschaft, Internet, Gesellschaft, Wissenschaft, Kultur, Wissenschaft, usw.)
In der Hauptkategorie (z.B. "Internet"), Unterkategorien (z.B. "Suchen") findet man die weitere Unterkategorie  (z.B. "Verzeichnisse") sowie Querverweise auf ähnliche Themengebiete (z.B. "Wissen") sowie weitere Unterkategorien (z.B. Open Directory Project). Um nun eine Seite in einem Internetverzeichnis zu finden, können Sie sich entweder von einer Hauptkategorie bis zu einem Themengebiet durchklicken (das sogenannte Browsing) oder das Internetverzeichnis über eine eingebaute Suchmaschine durchsuchen.
Es existieren große Webkataloge, die versuchen, das ganze WWW abzudecken. Daneben gibt es viele spezialisierte Kataloge, die sich auf ein Land, z.B. Deutschland oder mehrere Themen beschränken. (http://www.music.de bietet z.B. nur Links zur Musikszene  in Deutschland). Die speziali¬sierten Kataloge werden wir im Kapitel Spezialisierte Suchdienste noch näher erläutern.
Gute internationale Beispiele für Kataloge sind
- Verzeichnis dmoz.org
- Yahoo! Directory  dir.yahoo.com
Ein guter deutscher Webkatalog:
- Web.de dir.web.de/
Besondere Beispiele für von Bibliotheken gepflegte Kataloge mit qualitativ hochwertigen Inhalten:
- Librarians´Internet Index  lii.org/
- Deutsche Internetbibliothek  www.internetbibliothek.de/
Die manuelle Auswahl ist aufwendiger und nimmt mehr Zeit in Anspruch als die automatische Indexierung in Suchmaschinen, daher sind diese Verzeichnisse auch viel kleiner als die Indexe der Suchmaschinen. Wenn das größte Verzeichnis etwa 4,5 Millionen Internetseiten umfasst, ist es von der Anzahl der Links im Vergleich zu einer großen Suchmaschine  um mindestens den Faktor 10.000 kleiner. Meist sind Internetverzeichnisse jedoch noch deutlich kleiner und bestehen nur aus wenigen tausend ausgewählten Internetseiten. Allerdings können Sie in einem Internetverzeichnis auch Adressen finden, die von Suchmaschinen - technisch bedingt - nicht gefunden werden können. Da es sich in der Regel um bewertete Information handelt, ist die Qualität der Information höher.


== Überschrift 2 ==
== Überschrift 2 ==

Version vom 30. August 2009, 16:03 Uhr

Oftmals wird der Begriff Suchmaschinen ungenau eingesetzt, nämlich für alle Arten von Suchwerkzeugen bzw. Internetsuchdiensten. Viele Nutzer verwenden sehr schnell die überall bekannte Suchmaschine Google und vergessen allzu leicht, dass es eine Fülle an guten Internetsuchdiensten für die effiziente Suche im Internet gibt. Es gibt keine Suchmaschine, die für jede Fragestellung eine optimale Antwort geben kann - auch Google, die mit Abstand größte und erfolgreichste Suchmaschine der Welt, nicht.

Der erste Abschnitt erklärt die wichtigsten Suchdienste und sollte Entscheidungshilfe sein, was Sie über dieses Suchwerkzeug überhaupt finden können - und vor allem, was Sie nicht finden können. Wie man das passende Suchwerkzeug für die jeweilige Aufgabenstellung bzw. die Suchstrategie festlegt, ist dann die zweite Fragestellung.



Welche Suchdienste gibt es?

Internetsuchdienste können nach verschiedenen Kriterien differenziert werden. Grundlegend unterscheidet man, ob es sich um ein rein maschinelles System (daher der Name „Such¬maschine“), d. h. algorithmenbasiertes automatisches System handelt oder um eine manuell (von Menschen) erstellte Dokumentsammlungen (Verzeichnisse, Kataloge) auf der anderen Seite. Weiters unterscheiden wir, ob es sich um einen Universalsuchdienst oder einen Spezialsuchdienst handelt.

Manuell aufgebaute Link-Sammlungen waren der Beginn bei den Suchdiensten im WWW. Wir werden daher vorerst Linksammlungen/Internetverzeichnisse in umfangreicher Form auch Webkatalog genannt sowie Social Bookmarkdienste für manuell, d.h. von Menschen erstellte Systeme erläutern. Große roboterbasierte Suchmaschinen und Meta, suchmaschinen für rein maschinelle Systeme behandeln wir in der Folge. Spezialsuchmaschinen gibt es für viele Anwendungsbereiche, sie sind besonders interessante Suchdienste und teilweise wenig bekannt.

Manuell aufgebaute Link-Sammlungen waren der Beginn bei den Suchdiensten im WWW. Wir werden daher vorerst Linksammlungen/Internetverzeichnisse (in hierarchisch strukturierter Form auch Webkatalog genannt) sowie Social Bookmarkdienste für manuell erstellte Suchdienste erläutern. Große roboterbasierte Suchmaschinen und Meta¬such¬maschinen für rein maschinelle Systeme werden anschließend behandelt. Spezialsuchmaschinen gibt es für viele Anwendungsbereiche, sie sind, obwohl besonders interessant, eher wenig bekannt. Nachschlagewerke, Fachdaten¬banken und Bibliotheks¬kataloge sind weitere Suchdienste, im engeren Sinn aber keine Suchmaschinen. Große Bereiche des Internet werden von Datenbanken abgedeckt, die mit einer allgemeinen Suchmaschine nicht erreichbar sind. („Deep Web“, „Invisible Web“) Es handelt sich hierbei in erster Linie um themenspezifi¬sche Datenbanken, die erst über Anfragen dynamische Webseiten generieren. Die Anfragen können über das Web gestellt werden, die Seiten werden aber von den Suchmaschinen nicht indiziert. Der größte Teil des „Deep Web“ ist kostenfrei zugänglich, es gibt aber auch eine Reihe von kostenpflichtigen Suchdiensten und Hosts. Man schätzt, dass das „Invisible Web“ für den Wissenschaftsbereich eine Größe von zwischen 20 und 100 Milliarden Dokumenten ausmacht. [1]

Linksammlungen / Internetverzeichnisse, Webkataloge

Schon frühzeitig sammelte man Adressen von Webseiten im WWW in einem Internetverzeichnis. In einfachster Form entstand eine Linkliste. In einem Internetverzeichnis werden die Internetseiten von Menschen aufbereitet. Eine Person oder ein ganzes Redaktionsteam wählt Internetseiten aus. Dabei wird die Internetseite meist einer Prüfung unterzogen. Nach bestandener Qualitätsprüfung wird die Seite im Internetverzeichnis unter einem oder mehreren Themengebieten gespeichert. Bei sehr umfangreichen Verzeichnissen hat sich eine hierarchische Gliederung der Themengebiete bewährt, man spricht dann von einem Webkatalog. Der älteste und sehr umfangreiche Webkatalog ist die Virtual Library. (siehe http://vlib.org/). In manchen Verzeichnissen werden die Internetseiten auch bewertet, besonders "gute" Seiten werden z. B. mit einem Sternchen oder einer Lesebrille gekennzeichnet.

Berühmt ist das Open Directory Project mit dem dmoz-Verzeichnis. (siehe http://dmoz.org/) Es handelt sich dabei um den größten Webkatalog, den es derzeit im WWW gibt. „Im Juni 2009 verzeichnete das ODP über 4,5 Millionen Einträge – über 500.000 davon im deutschsprachigen Teil des Katalogs. Diese sind in über 700.000 Kategorien sortiert. Seit der Gründung des Projektes haben mehr als 80.000 Editoren zum Wachstum des Verzeichnisses beigetragen.“[2] Der Inhalt des Google Verzeichnis entspricht dem dmoz-Verzeichnis und ist mit der Page-Rank-Technologie von Google erweitert worden. Im deutsch¬sprachigen Teil des dmoz-Verzeichnis (http://www.dmoz.org/World/Deutsch/) findet man 16 Hauptkategorien (z.B. Computer, Wirtschaft, Internet, Gesellschaft, Wissenschaft, Kultur, Wissenschaft, usw.) In der Hauptkategorie (z.B. "Internet"), Unterkategorien (z.B. "Suchen") findet man die weitere Unterkategorie (z.B. "Verzeichnisse") sowie Querverweise auf ähnliche Themengebiete (z.B. "Wissen") sowie weitere Unterkategorien (z.B. Open Directory Project). Um nun eine Seite in einem Internetverzeichnis zu finden, können Sie sich entweder von einer Hauptkategorie bis zu einem Themengebiet durchklicken (das sogenannte Browsing) oder das Internetverzeichnis über eine eingebaute Suchmaschine durchsuchen. Es existieren große Webkataloge, die versuchen, das ganze WWW abzudecken. Daneben gibt es viele spezialisierte Kataloge, die sich auf ein Land, z.B. Deutschland oder mehrere Themen beschränken. (http://www.music.de bietet z.B. nur Links zur Musikszene in Deutschland). Die speziali¬sierten Kataloge werden wir im Kapitel Spezialisierte Suchdienste noch näher erläutern. Gute internationale Beispiele für Kataloge sind - Verzeichnis dmoz.org - Yahoo! Directory dir.yahoo.com Ein guter deutscher Webkatalog: - Web.de dir.web.de/ Besondere Beispiele für von Bibliotheken gepflegte Kataloge mit qualitativ hochwertigen Inhalten: - Librarians´Internet Index lii.org/ - Deutsche Internetbibliothek www.internetbibliothek.de/ Die manuelle Auswahl ist aufwendiger und nimmt mehr Zeit in Anspruch als die automatische Indexierung in Suchmaschinen, daher sind diese Verzeichnisse auch viel kleiner als die Indexe der Suchmaschinen. Wenn das größte Verzeichnis etwa 4,5 Millionen Internetseiten umfasst, ist es von der Anzahl der Links im Vergleich zu einer großen Suchmaschine um mindestens den Faktor 10.000 kleiner. Meist sind Internetverzeichnisse jedoch noch deutlich kleiner und bestehen nur aus wenigen tausend ausgewählten Internetseiten. Allerdings können Sie in einem Internetverzeichnis auch Adressen finden, die von Suchmaschinen - technisch bedingt - nicht gefunden werden können. Da es sich in der Regel um bewertete Information handelt, ist die Qualität der Information höher.

Überschrift 2

Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet.[3]

Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit, sed diam nonummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat volutpat.

Literatur

Quellen

  1. Dirk Lewandowski and Philipp Mayr, Exploring the Academic Invisible Web, in: Library Hi Tech, 2006, Volume 24, Issue 4, S. 529 – 539
  2. http://de.wikipedia.org/wiki/Open_Directory_Project (7.8.2009)
  3. http://www.idv.edu/


Weiterführende Links