Beziehungen in Datenbanken
In diesem Lernschritt werden die Beziehungen zwischen Tabellen einer relationalen Datenbank erläutert. Dabei darf nicht außer Acht gelassen werden, dass sowohl der Aufbau der Tabellen, als auch die Art der Beziehung zwischen den Tabellen von den Aufgaben, die der Datenbank zu Grunde liegen, abhängen. |
Beziehungen zwischen Tabellen
Unterschiedliche Datenbank-Modelle zielen auf unterschiedliche Nutzungsaspekte ab. Datenbanken von Suchmaschinen z.B. arbeiten zwar auch mit Tabellen (Listen), die jedoch womöglich schnell Ergebnisse in kürzester Zeit, bei gleichzeitig hoher Anzahl von Anfragen liefern müssen. Redundanzen schaden in diesem Fall wenig und auch Vollständigkeit des Ergebnisses ist nicht gefragt und auch kaum nachvollziehbar.
Relationale Datenbanken müssen Nachteile bei der Verarbeitung von Massendaten in kürzester Zeit hinnehmen, erheben aber Anspruch auf Vollständigkeit der Wiedergabe abgebildeter Entitäten, sind von unterschiedlichen Anwendungen gleichzeitig nutzbar und zielen vor allem auf Reduktion von Redundanzen ab. Die Regeln zur Bildung derart redundanzarmer Tabellensysteme sind in den Normalformen festgeschrieben.
Die von Redundanzen befreiten Tabellen einer relationalen Datenbank werden über ihre Schlüsselfelder verbunden, indem identifizierende Schlüssel (Primärschlüssel) einer Tabelle auf nicht identifizierende Schlüssel (Fremdschlüssel) anderer Tabellen verweisen. Dadurch entsteht eine Netz von Beziehungen zwischen den Tabellen einer Datenbank.
Funktionsweise von Schlüsseln
Aus gleichartigen Objekten und deren Attributen werden Objektklassen (Objekttypen, Entityklassen) gebildet. Eine Datei bildet eine Objektklasse ab; sie besteht aus einem oder mehreren Datensätzen. Jenes Feld oder jene Felder, mit denen Objekte einer Objektklasse eindeutig identifiziert werden können, werden Schlüssel (Schlüsselfeld/er) genannt. Sind Schlüssel aus mehreren Feldern zusammengesetzt, werden sie als Kombinationsschlüssel bezeichnet.
Ein Primärschlüssel vermag genau einen und nur einen Datensatz zu identifizieren. In unserem Beispiel ist dies die pro Buch vergebene, fortlaufende Buchnummer Nr. Manchmal werden auch Sekundärschlüssel definiert, die allerdings dadurch charakterisiert sind, dass sie sich nicht zur Identifizierung genau eines Objektes (hier: Buches) eignen, sondern Datensätze mit gleichen Eigenschaften in eine Klasse zusammenfassen. Im vorliegenden Beispiel ist das Feld Verlag ein Sekundärschlüssel, der wenn er zur Anwendung kommt, alle Bücher eines bestimmten Verlages zu einer Klasse zusammenfasst.
Welche Objektklassen im konkreten Fall zu bilden sind, welche Eigenschaften und deren Datentypen in den Feldern (Spalten) gewählt werden, hängt ausschließlich von den Erfordernissen der gestellten Aufgaben an die Datenbank ab.
Funktionsweise von Beziehungen
Damit eine relationale Datenbank ausreichend Daten zur Erfüllung gestellter Aufgaben liefern kann, ist im Regelfall die Auswertung mehrerer Tabellen notwendig. Um eine Rechnung im vorliegenden Übungsbeispiel zu erstellen, sind Daten aus den Tabellen (bzw. entsprechenden Entitäten) Kunde, Auftrag, Auftragsposition und Buch erforderlich. Da die genannten Tabellen jeweils Daten über alle Kunden, alle Aufträge, usw. enthalten, gilt es jene Menge an Daten zu selektieren, die den Erfordernissen einer Rechnung über einen bestimmten Auftrag eines bestimmten Kunden entsprechen. Die Selektion der entsprechenden Teilmenge an Daten wird durch Verbindung der relevanten Tabellen über die Schlüsselfelder, in Kombination mit Einschränkungen auf die gesuchten Entitäten, realisiert.
Eine Beziehung zwischen den Tabellen wird durch übereinstimmende Daten in den Schlüsselfeldern (jeweils der Primärschlüssel einer Tabelle mit Fremdschlüsseln in anderen Tabellen) definiert. Im Nachfolgenden Beispiel werden die Tabellen "Kunde" und "Auftrag" über das Primär- und Fremdschlüsselfeld mit der Bezeichnung "Kundennummer" verbunden.
Kundennummer | Vorname | Nachname | Straße | PLZ |
---|---|---|---|---|
37 | Elisabeth | Erlach | Glimpflinger Str. 13 | 5020 |
38 | Hans | Hinterholzer | Franziskanerweg 9 | 1040 |
39 | Hans-Peter | Wesp | Wüstenrotstraße 23 | 5201 |
40 | Konrad | Gampe | Berggasse 25 | 1010 |
Auftragsdatum | Kundennummer | Auftragsnummer |
---|---|---|
30.03.2000 | 38 | 254 |
02.05.2000 | 38 | 345 |
13.01.2003 | 34 | 12743 |
15.02.2003 | 20 | 3612873 |
Es gibt drei Typen von Beziehungen, die 1:1-, 1:n- und n:m-Beziehung.
1:1-Beziehung
In einer 1:1-Beziehung ist jedem Datensatz in Tabelle A nur ein passender Datensatz in Tabelle B zugeordnet. Diese Art von Beziehung hat eine untergeordnete Bedeutung, denn den Regeln der Normalformen entsprechend müssten alle Attribute, die eine Entität beschreiben, in einer Tabelle versammelt sein.
1:1-Beziehung werden z. B. dennoch verwenden, um eine Tabelle mit sehr vielen Feldern zu teilen, oder um einen Teil der Tabelle aus Gründen dezentraler Speicherung oder unterschiedlicher Zugriffsrechte wegen, abzutrennen.
1:n-Beziehung
Die 1:n-Beziehung ist der häufigste Beziehungstyp und damit auch der Standardfall. In der 1:n-Beziehung werden einem Datensatz in Tabelle A mehrere Datensätze in Tabelle B zugeordnet. Aber einem Datensatz in Tabelle B ist nie mehr als ein Datensatz in Tabelle A zugeordnet. Beispiel: Ein Kunde kann mehrere Aufträge erteilen, jedoch kann ein Auftrag nur von einem Kunde stammen.
m:n-Beziehung
In einer m:n-Beziehung können jedem Datensatz in Tabelle A mehrere Datensätze in Tabelle B zugeordnet sein und umgekehrt. Dieses Phänomen stammt aus der Natur der Sache.
Einer konstruierten Vorstellung entsprechend, ist das Verhältnis zwischen Aufträgen und Büchern eine n:m Beziehung. Viele (n) Aufträge enthalten ebenfalls viele (m) Bücher. Eine direkte Zuordnung zwischen Aufträgen und Büchern ist formal nur möglich, wenn die Entität "Auftragspositionen" dazwischen installiert wird. Die Beziehungslogik lautet dann:
Ein Auftrag enthält (hoffentlich) viele (n) Bücher (1:n) Jedes Buch ist (hoffentlich) in vielen (n) Aufträgen enthalten (1:n)
Die Entitäten (m) Aufträge und (n) Bücher werden über die zusätzlich eingeführte Entität "Auftragspositionen" mittels zwei 1:n-Beziehungen verbunden. Derart installierte Tabellen (geschaffene Entitäten) haben ein unverkennbares Merkmal: ihr Primärschlüssel besteht aus zwei geerbten Fremdschlüsseln aus den jeweils umgebenden Tabellen.
Nachfolgende Darstellung zeigt die Struktur der Tabellen: Auftrag, Auftragsposition und Buch sowie deren 1:n-Beziehungen, dargestellt mittels einfach (1) bzw. doppelt (n) gerichteten Kanten.
Diese Maßnahme führt alle Beziehungen zwischen Tabellen in relationalen Datenbanken auf 1:n-Beziehungen zurück.
Grafische Darstellung von Beziehungen
Den vorliegenden Ausführungen liegt eine Beispieldatenbank zugrunde, die einerseits als Modell für Beispiele zu den behandelten Themen dient, andererseits als interaktive Trainingsdatenbank dort eingesetzt wird, wo SQL-Anweisungen nicht nur erklärt, sondern auch zur praktischen Übung angeboten werden.
Bei der nachfolgenden Darstellung handelt es sich um eine frei erfundene, vereinfachte Form, die zum Ziel hat, Beziehungen zwischen Tabellen in allgemein verständlicher Form zu visualisieren. Die Namen der Tabellen sind durch Fettschrift hervorgehoben, die Attribute (Felder) der Tabellen sind eingerückt unter der Bezeichnung der Tabelle angeführt. Primärschlüsselfelder sind unterstrichen. Die einfache Pfeilspitze an den Kanten zwischen den Tabellen deuten auf die "1" von "1:n"-Beziehungen hin, die doppelten Pfeilspitzen auf das "n".
Das Zustandekommen der dargestellten Tabellen und ihrer Beziehungen ist Gegenstand des Datenbank-Entwurfsprozesses, der an dieser Stelle nicht zum Gegenstand gemacht wird. Wie diesem Beispiel zu entnehmen ist, werden alle Tabellen nach erfolgtem Entwurfsprozess mit 1:n-Beziehungen verbunden.
Das Arbeiten, insbesondere das Formulieren von Datenbank-Abfragen an eine konkrete Datenbank erfordert die genaue Kenntnis des Aufbaues aller Tabellen und deren Beziehungen untereinander.
Zitiervorschlag
Mittendorfer in Höller, Informationsverarbeitung, Beziehungen in Datenbanken (mussswiki.idb.edu/ivwiki)