SQL-Abfragen: Unterschied zwischen den Versionen
Zeile 93: | Zeile 93: | ||
</html> | </html> | ||
== Auswählen von Datensätzen == | == Auswählen von Datensätzen - bzw. bilden von Teil- und Vereinigungsmengen == | ||
Zu Beginn der Lerneinheit war von mengentheoretischen Überlegungen die Rede. Die Komponente DISTINCT hat zwar zur Bildung einer Teilmenge aus der Menge aller Vornamen bereits beigetragen, aber diese Methode ist für viele Anfragen an Datenbanken nicht ausreichend. | |||
Die WHERE-Komponente in Verbindung mit den nachfolgend angeführten Operatoren ermöglicht das Bilden von Vereinigungs- und Teilmengen unter Verwendung von Klammern, Vergleichen, Rechenoperationen und logischen Verbindungen. | |||
# ( ) | # ( ) | ||
Zeile 103: | Zeile 105: | ||
# NOT AND OR | # NOT AND OR | ||
8 Kunden mit dem Vornamen Achim befinden sich in der Datenbank. Gesucht sind nun der Vorname, Nachname und die Postleitzahl jener Kunden, deren Vornamen Achim lauten. Aufgelistet sollten diese aufsteigend nach dem Nachnamen werden. | |||
<pre>SELECT Vorname, Nachname | |||
<pre>SELECT Vorname, Nachname, PLZ | |||
FROM Kunde | FROM Kunde | ||
WHERE Vorname=' | WHERE Vorname='Achim' | ||
ORDER BY Nachname ASC</pre> | |||
<html> | <html> | ||
<form method="post" action="http://sql.idv.edu/thema/work/sql.php" target="_blank"> | <form method="post" action="http://sql.idv.edu/thema/work/sql.php" target="_blank"> | ||
<input type="hidden" name="select" value="SELECT Vorname, Nachname FROM Kunde WHERE Vorname=' | <input type="hidden" name="select" value="SELECT Vorname, Nachname, PLZ FROM Kunde WHERE Vorname='Achim' ORDER BY Nachname ASC"> | ||
<input type="submit" value="Ausführen"> | <input type="submit" value="Ausführen"> | ||
</form> | </form> | ||
Zeile 155: | Zeile 159: | ||
</form> | </form> | ||
</html> | </html> | ||
== Sortieren von Datensätzen == | == Sortieren von Datensätzen == |
Version vom 24. Februar 2013, 22:08 Uhr
Die Lerneinheit "SQL-Abfragen" dient der Erläuterung unterschiedlicher Anwendungsfälle der SQL-Anweisung "SELECT", die jeweils mit interaktiv ausführbaren Beispielen hinterlegt sind. Die interaktiv ausführbaren Beispiele beziehen sich auf die Trainingsdatenbank [1]. |
Die SELECT Anweisung
Relationale Datenbanken können mit Hilfe der SELECT-Anweisung ausgewertet werden, wenn die entsprechenden Zugriffsrechte vorliegen. Nachfolgende Beispiele beziehen sich auf die Implementierung eines SQL-Trainingsservers, welcher als interaktive Anwendung auch unter http://sql.idv.edu erreichbar ist. Die Zugriffsrechte auf die Lehr- und Übungsdatenbank über die vorliegende Schnittstelle erlauben lediglich die Anwendung der SELECT-Anweisung. Das Ausführun von Anweisungen, welche die Struktur oder den Inhalt der Datenbank ändern könnten, werden abgewiesen.
Den interaktiven Abfragen liegt folgendes Datenmodell zu Grunde:
Auswählen und Ausgeben von Datensätzen
Bei der Formulierung von Abfragen mittels SELECT-Anweisung ist die Anwendung von mengentheoretischen Grundkenntnissen sehr hilfreich. Grundsätzlich sind mittels SELECT alle Datensätze aller Tabellen einer Datenbank auswählbar (selectierbar). Die Kunst der richtigen Anwendung besteht aber darin, durch das Formulieren von Schnitt- und Vereinigungsmengen das richtige Ergebnis (= der gestellten Aufgabe entsprechende Menge) zu bilden. Beispiele für Aufgaben aus der vorliegenden Übungs-Datenbank sind:
- Die vollständigen Adressen aller Kunden in Nieder- und Oberösterreich.
- Eine Liste aller Chemie-Bücher, deren Preis niedriger als € 12,- ist.
- Die kumulierten Umsätze des Jahres 2000 aller Kunden, absteigend aufgelistet nach Bundesländern.
Alle Ergebnisse einer SELECT-Anweisung werden in Form von Listen (bzw. Tabellen) erzielt. In der Praxis sind die erzielten Ergebnisse Teil einer (Computer)Anwendung, welche aus dem unermesslichen Repertoire Anwendungen stammt und an dieser Stelle keine weitere Behandlung mehr bedarf. Siehe: Datenbank-Grundlagen#Was_sind_und_wozu_dienen_Datenbanken.3F
Die Idee der Auswertung dieser Übungs-Datenbank ist die Weiterverarbeitung und Tabellenkalkulationsprogrammen. Zu diesem Zwecke wird am Ende jedes Ergebnisses die Funktion "Download as CSV" angeboten.
SELECT- Die Grundform
Das erste Beispiel erzeugt eine Liste aller Vornamen der Kunden (aus der Tabelle Kunde). Die Grundform verlangt mindestens die Komponenten SELECT und FROM. Nach der Komponente SELECT wollen die Namen der Spalten (Felder) genannt werden, nach dem FROM jene Tabelle(n) aus denen die gesuchten Felder stammen. Als Einstieg wir lediglich aus einer Tabelle selektiert.
SELECT Vorname FROM Kunde
<html> <form method="post" action="http://sql.idv.edu/thema/work/sql.php" target="_blanc"> <input type="hidden" name="select" value="SELECT Vorname FROM Kunde"> <input type="submit" value="Ausführen"> </form> </html>
Möchte man mehr als ein Feld aufgelistet haben, so werden diese durch Komma getrennt nacheinander angeführt. Nachfolgendes Beispiel sucht nach den Inhalten der Felder Vorname, Nachname und Plz der Kunden (aus der Tabelle Kunde).
SELECT Vorname, Nachname, Plz FROM Kunde
<html> <form method="post" action="http://sql.idv.edu/thema/work/sql.php" target="_blanc"> <input type="hidden" name="select" value="SELECT Vorname, Nachname, Plz FROM Kunde"> <input type="submit" value="Ausführen"> </form> </html>
Bemerkenswert ist, dass alle Datensätze der Tabelle "Kunde" ausgewählt und ausgegeben werden und diese prinzipiell unsortiert sind.
Ist die Anzahl der Felder, bzw. deren Namen unbekannt, so führt folgendes SELECT zur Auswahl aller Datensätze mit all ihren Feldern. Der gesamte Inhalt der Tabelle "Kunde" wird demnach selektiert und ausgegeben. 999 Kunden sollen gefunden und angezeigt werden.
SELECT * FROM Kunde
<html> <form method="post" action="http://sql.idv.edu/thema/work/sql.php" target="_blanc"> <input type="hidden" name="select" value="SELECT * FROM Kunde"> <input type="submit" value="Ausführen"> </form> </html>
Sortieren der Datensätze und Ausschließen von Wiederholungen
Gleiche Inhalte von Feldern in unterschiedlichen Datensätzen ist keine Seltenheit. Es würde überraschen, wenn bei 999 Kunden manche Vornamen nicht mehrfach vorkämen. Eine einfache Methode dies zu überprüfen ist, die Reihenfolge der Vornamen der Kunden alphabetisch zu sortieren. Das SELECT-FROM wird um die Komponente ORDER BY ergänzt. "ASC" steht für ascending, was aufsteigend sortiert bedeutet.
SELECT Vorname FROM Kunde ORDER BY Vorname ASC
<html> <form method="post" action="http://sql.idv.edu/thema/work/sql.php" target="_blanc"> <input type="hidden" name="select" value="SELECT Vorname FROM Kunde ORDER BY Vorname ASC"> <input type="submit" value="Ausführen"> </form> </html>
Haben Sie das Ergebnis überprüft? Wer hätte gedacht, dass sich 8 Achims in der Kundenliste befinden? Sollen alle Duplikate aus der Liste verschwinden, so kommt die Komponente DISTINCT zum Einsatz.
SELECT DISTINCT Vorname FROM Kunde ORDER BY Vorname ASC
<html> <form method="post" action="http://sql.idv.edu/thema/work/sql.php" target="_blank"> <input type="hidden" name="select" value="SELECT DISTINCT Vorname FROM Kunde ORDER BY Vorname ASC"> <input type="submit" value="Ausführen"> </form> </html>
Auswählen von Datensätzen - bzw. bilden von Teil- und Vereinigungsmengen
Zu Beginn der Lerneinheit war von mengentheoretischen Überlegungen die Rede. Die Komponente DISTINCT hat zwar zur Bildung einer Teilmenge aus der Menge aller Vornamen bereits beigetragen, aber diese Methode ist für viele Anfragen an Datenbanken nicht ausreichend.
Die WHERE-Komponente in Verbindung mit den nachfolgend angeführten Operatoren ermöglicht das Bilden von Vereinigungs- und Teilmengen unter Verwendung von Klammern, Vergleichen, Rechenoperationen und logischen Verbindungen.
- ( )
- * /
- + -
- = <> > <
- NOT AND OR
8 Kunden mit dem Vornamen Achim befinden sich in der Datenbank. Gesucht sind nun der Vorname, Nachname und die Postleitzahl jener Kunden, deren Vornamen Achim lauten. Aufgelistet sollten diese aufsteigend nach dem Nachnamen werden.
SELECT Vorname, Nachname, PLZ FROM Kunde WHERE Vorname='Achim' ORDER BY Nachname ASC
<html> <form method="post" action="http://sql.idv.edu/thema/work/sql.php" target="_blank"> <input type="hidden" name="select" value="SELECT Vorname, Nachname, PLZ FROM Kunde WHERE Vorname='Achim' ORDER BY Nachname ASC"> <input type="submit" value="Ausführen"> </form> </html>
Bei Zeit/Zahlenwerten als Bedingung ist nicht nur das "="-Zeichen erlaubt, sondern auch <, >, <>, >= und <=. Im Gegensatz zu Textwerten müssen diese dann auch nicht in einfache Anführungszeichen gesetzt werden.
Das Auswahlverfahren könnte nun mithilfe von Boolschen Operatoren (AND, OR, NOT usw.) verfeinert werden. Die Abfrage unterhalb gibt die Spalten Vorname, Nachname und Plz der Datensätze in der Tabelle Kunde aus, die im Feld Vorname "Michael" entsprechen und eine Plz kleiner 4030 besitzen.
SELECT Vorname, Nachname, Plz FROM Kunde WHERE Vorname='Michael' AND Plz<4030
<html> <form method="post" action="http://sql.idv.edu/thema/work/sql.php" target="_blank"> <input type="hidden" name="select" value="SELECT Vorname, Nachname, Plz FROM Kunde WHERE Vorname='Michael' AND Plz<4030"> <input type="submit" value="Ausführen"> </form> </html>
Diese Abfrage gibt die Spalten Vorname, Nachname und Plz jeder Zeile der Tabelle Kunde aus, die eine Plz zwischen 1010 und 4030 besitzt.
SELECT Vorname, Nachname, Plz FROM Kunde WHERE Plz BETWEEN 1010 AND 4030
<html> <form method="post" action="http://sql.idv.edu/thema/work/sql.php" target="_blank"> <input type="hidden" name="select" value="SELECT Vorname, Nachname, Plz FROM Kunde WHERE Plz BETWEEN 1010 AND 4030"> <input type="submit" value="Ausführen"> </form> </html>
Ist nur ein Teil des Suchbegriffs innerhalb eines Feldes bekannt, so kann nach diesen Schlüsselwörtern gesucht werden. Das "%"-Zeichen dient als Platzhalter, welcher beliebige (und beliebig viele) Zeichen davor bzw. danach zulässt. Folglich gibt die nächste Abfrage die Spalten Vorname und Nachname der Datensätze in der Tabelle Kunde aus, die im Feld Nachname "Muster" an beliebiger Stelle enthalten.
SELECT Vorname, Nachname FROM Kunde WHERE Nachname LIKE '%Muster%'
<html> <form method="post" action="http://sql.idv.edu/thema/work/sql.php" target="_blank"> <input type="hidden" name="select" value="SELECT Vorname, Nachname FROM Kunde WHERE Nachname LIKE '%Muster%'"> <input type="submit" value="Ausführen"> </form> </html>
Sortieren von Datensätzen
Selbstverständlich können die auszugebenden Datensätze im Ergebnis auch nach bestimmten Kriterien gereiht werden. Diese Sortierung geschieht durch den Zusatz ORDER BY, gefolgt von den Feldern, nach denen sortiert werden soll (im Beispiel zuerst nach dem Nachnamen und danach nach dem Vornamen). Weiters kann noch bestimmt werden, ob dies aufsteigend (ASC) oder absteigend (DESC) geschehen soll.
SELECT Vorname, Nachname FROM Kunde ORDER BY Nachname, Vorname ASC
<html> <form method="post" action="http://sql.idv.edu/thema/work/sql.php" target="_blank"> <input type="hidden" name="select" value="SELECT Vorname, Nachname FROM Kunde ORDER BY Nachname, Vorname ASC"> <input type="submit" value="Ausführen"> </form> </html>
Verbinden von Tabellen
Zur Unterstützung zahlreicher Aufgaben aus dem betrieblichen Alltag werden Daten benötigt, die über mehrere Tabellen hinweg verteilt sind. Das Zusammenführen von Feldern aus mehreren Tabellen heißt auch Join und wird ebenfalls in der WHERE-Komponente definiert.
Bei Abfragen, die über mehrere Tabellen gehen, ist es ratsam, die Feldnamen in Verbindung mit dem Tabellennamen anzuführen. Aus Vorname wird Kunde.Vorname. Diese Maßnahme ist dann notwendig, wenn in ein und derselben Abfrage idente Feldbezeichnungen auftauchen. Die Kunde.Nr muss z. B. von der Artikel.Nr und diese von der Buch.Nr unterschieden werden können.
Die Verbindung der benötigten Tabellen erfolgt über die Schlüsselfelder. In der Regel wird ein Primärschlüssel einer Tabelle mit einem Fremdschlüssel einer weiteren Tabelle verbunden. Dazu ist es hilfreich, das normalisierte Datenmodell zu verwenden. Die gerichteten Kanten weisen den Weg der Verbindungen (Joins).
SELECT Tabelle1.Feld1, Tabelle2.Feld1, Tabelle2.Feld2 FROM Tabelle1, Tabelle2 WHERE (Tabelle1.Feld2=Tabelle2.Feld2)
Diese Art der Abfrage wird dazu verwendet, um Daten aus zwei verschiedenen Tabellen zu einem Datensatz zu kombinieren. Somit wird das WHERE hier nicht mehr zur Selektion verwendet (so wie in den vorangegangenen Beispielen), sondern zur Projektion von Daten. Sobald also mit einer etwas komplexeren Datenbank mit mehreren verbundenen Tabellen gearbeitet wird, ergibt sich die Notwendigkeit, auf diese Art und Weise an die benötigten Daten zu kommen.
Für das Beispiel wird nun eine zweite Tabelle (die Tabelle PLZ) benötigt. Die Informationen, die zu einer Postleitzahl gehören, wurden in diese ausgelagert. Die beiden Tabellen PLZ und Kunde sind über das Feld Plz verbunden. Achtung: Bei diesem Beispiel darf man sich nicht verwirren lassen, dass der Tabellenname PLZ genauso lautet wie das Feld Plz!
SELECT Kunde.Vorname, Kunde.Nachname, Kunde.Plz, PLZ.Ort FROM Kunde, PLZ WHERE (Kunde.Plz=PLZ.Plz)
<html> <form method="post" action="http://sql.idv.edu/thema/work/sql.php" target="_blank"> <input type="hidden" name="select" value="SELECT Kunde.Vorname, Kunde.Nachname, Kunde.Plz, PLZ.Ort FROM Kunde, PLZ WHERE (Kunde.Plz=PLZ.Plz)"> <input type="submit" value="Ausführen"> </form> </html>
Gruppieren von Datensätzen
Die GROUP BY-Klausel bewirkt, dass die aus einer Abfrage resultierende Tabelle in Gruppen gegliedert wird. Dazu muss in der GROUP BY-Klausel angegeben werden, nach welchem Kriterium die Gruppierung erfolgen soll. Dieses Kriterium, der Gruppierungsschlüssel, ist im einfachsten Fall ein Attribut der Ausgangstabelle. Alle Zeilen mit demselben Wert des Gruppierungsschlüssels fallen in dieselbe Gruppe. Eine Gruppe ist also nichts anderes als eine Teiltabelle. Im Ergebnis wird jede Gruppe durch die Anwendung von Gruppierungsfunktionen auf eine einzelne Zeile zusammengefasst.
Als typische Gruppenfunktionen bzw. Aggregatsfunktionen gelten:
- COUNT
- SUM
- AVG
- MAX
- MIN
Die Gruppenfunktionen werden analog zu gängigen Funktionen in Tabellenkalkulationsprogrammen angewandt und notiert, z. B. SUM(Auftragspos.Menge * Buch.Preis).
Diese Abfrage gibt das gruppierte Feld Region und die Anzahl der Orte, die "kirche" enthalten, aus der Tabelle PLZ aus und sortiert diese neue Tabelle absteigend anhand der zweiten Spalte.
SELECT Region, COUNT(*) FROM PLZ WHERE Ort LIKE '%kirche%' GROUP BY Region ORDER BY 2 DESC
<html> <form method="post" action="http://sql.idv.edu/thema/work/sql.php" target="_blank"> <input type="hidden" name="select" value="SELECT Region, COUNT(*) FROM PLZ WHERE Ort LIKE '%kirche%' GROUP BY Region ORDER BY 2 DESC"> <input type="submit" value="Ausführen"> </form> </html>
Mit der Gruppenfunktion generierte Spalten können mit AS benannt und dadurch auch für weitere Aktionen (z. B. ORDER BY) innerhalb derselben Abfrage verwendet werden. Die folgende Abfrage stellt bereits eine eher komplexe Abfrage mit einigen Joins dar. Sie gibt die Spalten Kunde.Nr, Kunde.Nachname, PLZ.Ort und den errechneten Umsatz aus den Tabellen PLZ, Kunde, Auftrag, Auftragspos und Buch aus, gruppiert das Ergebnis nach der Kundennummer und sortiert es am Nachnamen.
SELECT Kunde.Nr, Kunde.Nachname, PLZ.Ort, SUM(Auftragspos.Menge*Buch.Preis) AS Umsatz FROM PLZ, Kunde, Auftrag, Auftragspos, Buch WHERE PLZ.Plz=Kunde.Plz AND Kunde.Nr=Auftrag.Kundennummer AND Auftrag.Nr=Auftragspos.Auftragsnummer AND Auftragspos.Buchnummer=Buch.Nr GROUP BY Kunde.Nr, Kunde.Nachname, PLZ.Ort ORDER BY Kunde.Nachname
<html> <form method="post" action="http://sql.idv.edu/thema/work/sql.php" target="_blank"> <input type="hidden" name="select" value="SELECT Kunde.Nr, Kunde.Nachname, PLZ.Ort, SUM(Auftragspos.Menge*Buch.Preis) AS Umsatz FROM PLZ, Kunde, Auftrag, Auftragspos, Buch WHERE PLZ.Plz=Kunde.Plz AND Kunde.Nr=Auftrag.Kundennummer AND Auftrag.Nr=Auftragspos.Auftragsnummer AND Auftragspos.Buchnummer=Buch.Nr GROUP BY Kunde.Nr, Kunde.Nachname, PLZ.Ort ORDER BY Kunde.Nachname"> <input type="submit" value="Ausführen"> </form> </html>
Selektion (Einschränkung) auf eine Gruppierung (Aggregierung) von Datensätzen
Besteht der Bedarf, das Ergebnis einer Aggregatsfunktion einzuschränken, so geschieht dies nicht in der WHERE Klausel, sondern in der HAVING Klausel, welche nach dem GROUP BY zur Anwendung kommt.
Beispiel: Der ermittelte Kundenumsatz aus obigem Beispiel soll auf jene Kunden eingeschränkt werden, deren Umsatz den Betrag von 100000 erreicht oder übersteigt. Erwartet wird eine Liste der Kundenumsätze mit den Merkmalen: Nummer, Nachname, Ort und Summe, sortiert nach dem Nachnamen des Kunden.
SELECT Kunde.Nr, Kunde.Nachname, PLZ.Ort, SUM(Auftragspos.Menge*Buch.Preis) AS Umsatz FROM PLZ, Kunde, Auftrag, Auftragspos, Buch WHERE PLZ.Plz=Kunde.Plz AND Kunde.Nr=Auftrag.Kundennummer AND Auftrag.Nr=Auftragspos.Auftragsnummer AND Auftragspos.Buchnummer=Buch.Nr GROUP BY Kunde.Nr, Kunde.Nachname, PLZ.Ort HAVING SUM(Auftragspos.Menge*Buch.Preis >= 100000 ORDER BY Kunde.Nachname
<html> <form method="post" action="http://sql.idv.edu/thema/work/sql.php" target="_blank"> <input type="hidden" name="select" value="SELECT Kunde.Nr, Kunde.Nachname, PLZ.Ort, SUM(Auftragspos.Menge*Buch.Preis) AS Umsatz FROM PLZ, Kunde, Auftrag, Auftragspos, Buch WHERE PLZ.Plz=Kunde.Plz AND Kunde.Nr=Auftrag.Kundennummer AND Auftrag.Nr=Auftragspos.Auftragsnummer AND Auftragspos.Buchnummer=Buch.Nr GROUP BY Kunde.Nr, Kunde.Nachname, PLZ.Ort HAVING SUM(Auftragspos.Menge*Buch.Preis) >= 100000 ORDER BY Kunde.Nachname"> <input type="submit" value="Ausführen"> </form> </html>
Literatur
Weiterführende Links
Zitiervorschlag
Mittendorfer in Pils, Informationsverarbeitung I (24. 2. 2013), SQL-Abfragen (mussswiki.idv.edu/iv1)