Datenbank-Grundlagen

Aus IV
Zur Navigation springen Zur Suche springen
<yambe:breadcrumb>Datenbanken|Datenbanken</yambe:breadcrumb>
Eine wesentliche Funktion eines Computersystems besteht darin, Daten, Texte, Bilder, Sprache, Sounds (oder auch Kombinationen mehrerer Informationsarten) zu speichern, so dass deren bedarfsgerechtes, insbesondere rasches und einfaches Wiederauffinden und Nutzen ermöglicht wird.

Das Kapitel der Datenbanken behandelt insbesondere, wie große Datenmengen dauerhaft und zuverlässig gespeichert und bei Bedarf abgerufen werden können. Dazu ist es erforderlich, die für einen oder mehrere Benutzer relevanten Ausschnitte aus der Realität einzugrenzen, und Letztere in konventionellen Dateisystemen oder in Datenbanken abzubilden. Grundlegende Fragen der Datenorganisation und der Planung von Datenbanksystemen sowie verbreitete Werkzeuge zur Nutzung von Datenbanken (insbesondere SQL) sind daher Inhalte des an dieser Stelle eingeleiteten Kapitels.


Was sind und wozu dienen Datenbanken?

Datenbanken sind strukturierte Lagerstätten für Daten aller Art. Das zentrale, strukturgebende Element in Datenbanken sind Tabellen, die aus Zeilen (Sätzen) und Spalten (Feldern), bestehen. Das kleinste, atomistische Element in einer Datenbank ist die Ausprägung eines Feldes in einem konkreten Datensatz. In Tabellenkalkulationsprogrammen wird in diesem Zusammenhang von "Zelle" gesprochen und entspricht z.B. dem Nachnamen eines Kunden. Der Umfang, die Zusammensetzung und der Aufbau der Tabellen in Datenbanken bzw. deren Felder ist nicht willkürlich, sondern Regeln unterworfen. Tabellen gehören, insbesondere in Form von Listen zu millionenfach benutzten Modell organisierender, strukturierender oder auch nur darstellender Maßnahmen. Die überwiegende Mehrzahl solcher Tabellen und Listen stammt, wenn automatisiert erzeugt, aus Datenbanken. Mehr über Tabellen in Datenbanken erfahren Sie im weiterführenden Kapitel.

Das Web bezieht seine sekündlich und milliardenfach, die mit Hilfe der Netze ausgelieferten und über die Browser dargestellten Inhalte vornehmlich aus Datenbanken. So gesehen ist die Facebook-Timline eines Mitgliedes eine Liste, bzw. Tabelle aus Datenbankinhalten mit den Feldern: Profilbid, Datum, Beitragsbild, Beitragstext, Anzahl der "Likes" u.a.m. welche aus einer immensen Datenbank selektiert und mit Layout-Paramtern versehen zum typischen Web-Erscheinungsbild kombiniert wird. Mit Hilfe desselben Erscheinungsbildes, man könnte es auch Forumular nennen, können die dargestellten Daten aber auch gelöscht, verändert oder ergänzt und anschließend als neuer oder veränderter Beitrag in die immense Datenbank rücktransferiert werden.

Wie am einfachen Beispiel bereits erkennbar, enthalten Datenbanken auch unterschiedliche Datentypen, wie z.B. Texte, Datumswerte, Fotos oder auch nur die an sich winzige Information darüber, ob man etwas mag (like) oder eben nicht. Mögen, oder nicht Mögen kann im Grenzfall mehr bewirken als ein preisverdächtiges Foto und benötigt dennoch nur den Platz der allerkleinsten Speicherheinheit: dem Bit.

Obwohl - glaubt man den Studien - sich die meisten NutzerInnen der Social Media über Wirkung und Reichweite Ihrer Postings wenig Gedanken machen, ist der Zugriff auf Einzelheiten in den Tabellen der Datenbanken mittels Zugriffsrechten lenk- und begrenzbar. Wer demnach berechtigt sein soll Daten zu lesen, löschen, verändern oder ergänzen, unterliegt eigenen Reglerwerken, von den Bedarfen unterschiedlicher Gruppierungen an Nutzern oder Rollen in Organisationen abgeleitet.

Das soeben beispielhaft Dargelegte gilt selbstredend für ungezählte Anwendungen aus allen Bereichen in denen Computer und Netzwerke zur Lösung von Aufgaben eingesetzt werden. Im Hintergrund, weil sie sich eben auf den Oberflächen nicht immer leicht zu erkennen geben, arbeiten Datenbanken. In betrieblichen und behördlichen Informationssystemen, Freizeit- und Arbeitsumgebungen, spielerischen und ernsthaften Metiers des modernen, mobilen Lebens.

Wer Zugriff auf die permanent wachsenden, immensen Datenbestände in Datenbanken hat, besitzt ökonomische oder politische Macht. Digitale Werkzeuge bzw. Tools (Algorithmen) zur automatisierten quantitativen und qualitativen Auswertung von Datenbeständen filtern, ordnen, berechnen und verbinden die in Tabellen scheinbar isolierten Daten zu neuen Erkenntnissen. Damit werden die Geschicke von Unternehmen gelenkt, politische Entscheidungen getroffen, die Finanzmärkte dirigiert, aber auch Leistungsbeurteilungen in Lehrveranstaltungen ermittelt. Manchmal handeln die Datenbank-auswertenden Algorithmen eigenmächtig und ohne menschliche Kontrolle. Sie kaufen und verkaufen, setzen Kurse fest. Der überwiegende Teil des Geldes, bzw. jener Werte, die Geldes wert auf Finanzmärkten gehandelt werden, lagert nicht in Scheinen und Münzen, sondern als hoffentlich gut gehüteten Zahlen in Datenbanken der Geldinstitute und Börsen, als Buchgeld bekannt. Verluste in Krisenzeiten sind demnach nicht Verluste an Banknoten, sondern "lediglich" Subtraktionen, die auf Kontodaten ausgeführt werden.

Handeln die Daten von Menschen, sagen sie direkt oder indirekt etwas über Personen aus, so werden damit die größten Schattenseiten der Anwendung von Datenbanken angesprochen. Der Praxis effektivster und gleichzeitig schädigender Verknüpfung und Auswertung personenbezogener Daten wegen, wurde bereits Ende der 1970er Jahre in vielen Ländern der heutigen Europäischen Union ein Gesetz zum Schutz der Privatsphäre, ein Datenschutzgesezt erlassen. Mit der Verbreitung des Internets ist das Thema Datenschutz aktueller denn je und steht im diametralen Widerstreit zur bereits erwähnten wirtschaftlichen und politischen Macht derer, die insbesondere auf Daten der Nutzer des Internet und Mobilnetzen Zugriff haben.

Den technische Hintergrund fast aller geschilderten Phänomene bilden Datenbanken in Zusammenarbeit mit Apps, Programmen, Anwendungen, Robots oder welchen Namen man den Containern von Algorithmen geben möchte.

Dateien

Dateien bilden die Vorstufe zu den Datenbanken. Sie "stopfen" alle, für eine bestimmte Aufgabe, notwendigen Daten (Felder zu Sätzen zusammengefasst) in eine tabellarische Form. Eine Praxis, die für viele Aufgaben des Alltags ausreicht und die vorwiegende Übung der Anwendung von Tabellenkalkulationsprogrammen ist.

Auch Dateien haben ihre Gesetzmäßigkeit

Ein Satz (Datensatz, data record, record) bildet ein Objekt der Realität vereinfachend in einem Computersystem ab. Ein solches Objekt (Entität, entity) kann ein konkreter Gegenstand, ein Ereignis oder auch ein abstrakter Begriff sein. Es wird durch seine Attribute (Merkmale, Eigenschaften) beschrieben. Das Objekt Lehrbuch kann beispielsweise durch die Attribute Nummer, Autor, Titel, Preis, Verlag, Auslaufend und Bestand beschrieben werden. Die konkreten Inhalte der Attribute eines konkreten Lehrbuches werden Feldern (Datenfelder, fields) zugewiesen. Alle Felder eines konkreten Objektes bilden einen Datensatz.


Auszug aus einer Lehrbuch-Datei
Nummer Autor Titel Preis Verlag Auslaufend Bestand
1 Oberleitner ausgewaehlte Stücke 11,69 hoe n 25
2 Seyr Elektrotechnik - Fachkunde 2 19,00 oev n 24
219 Wanzenboeck Getting Better 2 19,70 oev n 93

Die Datenfelder sind mit einem Namen versehen, der sich oftmals mit der Bezeichnung des Attributes deckt und in den Spaltenüberschriften tabellarischer Darstellung auftaucht. Daten können eines unterschiedlichen Datentyps sein. Die Felder Nummer und Bestand sind z. B. vom Typ Ganzzahl, das Feld Preis vom Typ Dezimalzahl. Die Felder Autor, Titel und Verlag sind vom Typ Text und das Feld Auslaufend vom Typ Flag (mit den Ausprägungen "y" oder "n").

Relationale Datenbanken

Datenbanken verteilen die Daten auf mehrere Tabellen, die jeweils unterschiedlich voneinander abhängen und demnach unterschiedliche Grundmodelle bilden: Hierarchien, Netze oder die auf Reduktion von Redundanzen abzielenden Relationen. Sogenannte Schlüsselfelder (keys) dienen der Verknüpfung zwischen Tabellen siehe: Beziehungen in Datenbanken.

Relational ist eine Datenbank dann, wenn die Abbilder der Entitäten derart auf Tabellen aufgeteilt sind, dass ihre Merkmale (Eigenschaften) nur in Ausnahmefällen mehrfach (redundant) gespeichert sind. Die Datenmengen können dadurch gering gehalten werden und die Daten sind vor allem integer, was so viel wie frei von Widersprüchen bedeutet. Das Anordnen der Daten in widerspruchsfreien Tabellen geschieht nach den Regeln der Normalformen. Datenbanken nach dem relationalen Modell sind am häufigsten anzutreffen.

Literatur

Quellen

R. Elmasri, S. B. Navathe: Grundlagen von Datenbanksystemen. Ausgabe Grundstudium. Pearson Studium 2005

Weiterführende Links

Zitiervorschlag

Mittendorfer in Höller, Informationsverarbeitung, Datenbank-Grundlagen (mussswiki.idb.edu/ivwiki)