Logo des digitalen Schulbuchs inf-schule.de. Schriftzug in Zustandsübergangsdiagramm eines endlichen Automaten.

Fachkonzept - SQL-Join

Verbinden von Datensätzen in SQL

Will man in SQL Daten aus mehreren Tabellen ausgeben, so werden sog. "Joins" gebildet. Dabei muss der Programmierer angeben, wie die Tabellen miteinander verbunden werden sollen.

Die Abarbeitung eines Joins kann man sich in mehreren Schritten vorstellen:

1. Schritt: Auswahl der Tabellen

SQL Fenster öffnen Zunächst werden im FROM-Teil alle Tabellen angegeben, die die auszugebenden Daten enthalten. Die Reihenfolge spielt dabei keine Rolle, z.B.:

SELECT *
  FROM benutzer, bild

Das Ergebnis ist unerwartet (nicht alle Attribute gezeigt):

Ergebnistabelle des SQL-Befehls. Datensätze der Benutzer werden mehrfach gezeigt - verbunden mit nicht zugehörigen Bildern.

Statt nur passende Daten auszugeben, wird jeder Benutzer mit allen Bildern "gekreuzt"; es entsteht ein sog. cross join der Tabellen benutzer und bild ("jeder mit jedem").

2. Schritt: Angabe der Verbindung

Gut erkennbar ist, dass die beiden Attribute PNR (einmal aus der benutzer-Tabelle, einmal aus der bild-Tabelle) nicht zueinander passen. Diese Verbindung der Tabellen muss explizit bei der Abfrage im SQL-Befehl angegeben werden.

SQL Fenster öffnen Um Doppeldeutigkeiten der Attributnamen zu vermeiden, wird jedem Attribut der Tabellenname vorangestellt:

SELECT *
  FROM benutzer, bild
 WHERE benutzer.PNR = bild.PNR

Dies liefert (fast) das gewünschte Ergebnis:

Ergebnistabelle des SQL-Befehls. Es werden die Benutzer nur jeweils mit passenden Bildern angezeigt.

Um zwei Tabellen miteinander zu verbinden (engl. to join), muss im WHERE-Teil des SQL-Befehls eine Joinbedingung angegeben werden.
Diese legt fest, dass nur "passende" Datensätze ausgegeben werden, bei denen der Fremdschlüssel der abhängigen Tabelle zum Primärschlüssel der übergeordneten Tabelle passt (sog. inner join).

3. Schritt: Einschränken des Ergebnisses

SQL Fenster Im letzten Schritt kann noch die Anzahl der Datensätze durch weitere Bedingungen eingeschränkt werden. Außerdem sollte die Liste der Attribute eingegrenzt werden (z.B. um die doppelten Angaben aus Fremd- und Primärschlüssel zu entfernen):

SELECT benutzer.PNR, benutzer.Name, benutzer.Vorname,
       bild.Kategorie, bild.Name
  FROM benutzer, bild 
 WHERE benutzer.PNR = bild.PNR
   AND benutzer.Ort = 'Trier'
 ORDER BY benutzer.Name

Beachte, dass jetzt bei allen Attributen die zugehörige Tabelle vorangestellt wird.

Ergebnistabelle des SQL-Befehls. Benutzer aus Trier mit ihren Bildern. Nur relevante Attribute werden gezeigt.

Bei Bedingungen sollten niemals interne Werte der künstlichen Schlüsselattribute verwendet werden. Bedingungen der Form bild.PNR=1012 sind sehr fehleranfällig (z.B. wenn intern einmal Schlüssel geändert werden) und können durch Joins ersetzt werden - auch wenn dadurch die Anfrage minimal länger dauert.

X

Fehler melden

X

Suche