Problem mit JOINs

Max123 · 3. September 2007, 22:12

Hallo!

Ich habe folgende Abfrage:

Quellcode

SELECT comments.*, user.name, ratings.rating
FROM comments
JOIN user ON user.id = comments.user
JOIN ratings ON comments.user = ratings.user AND comments.movie = ratings.movie
WHERE comments.movie = "4" AND [...];

Nun ist allerdings in der Tabelle "ratings" nicht immer ein Datensatz vom Benutzer verfügbar.
Dann erhalte ich gar kein Ergebnis. Alle anderen Datensätze sind garantiert verfügbar

Ich möchte aber in jedem Fall ein Ergebnis haben, also einfach bei ratings.rating ein Ergebnis alá NULL, hauptsache, ich erhalte den Datensatz, Rating hin oder her.
Ob ein Rating verfübar ist bzw. ein vernünftiger Wert zurück kam, überprüfe ich vor der Ausgabe.

*edit*: Bin ein JOIN Neuling!

Torben Brodt · 3. September 2007, 22:13

mit einem LEFT JOIN erlaubst du auch Nullwerte auf der rechten Seite,

Quellcode

...LEFT JOIN ratings ON...

Max123 · 3. September 2007, 22:14

Schnelle Antwort, präzise Hilfe.
Nun läufts.

Danke d0nut!
Deshalb werde ich auf ewig in diesem Forum bleiben!

Hafner · 6. September 2007, 14:29

Ich würde mal dreist behaupten, dass man alles, was man mit JOINs machen kann auch mit WHERE machen kann. Nur um eine Alternative zu nennen.

Torben Brodt · 6. September 2007, 14:45

....aber mit einer ganz unterschiedlichen Performance.

Wenn du hier stattdessen einen CROSS JOIN gemacht hättest (entspricht der Schreibe ...FROM tableA, tableB WHERE....) dann würden erst alle Datensätze kombiniert werden. Also O(n²)! Auf die zusammengesetzte Masse würde die Einschränkung mit WHERE gemacht werden. Beim JOIN wird nur kombiniert was mit der JOIN Bedingung matcht.

Du kannst ja mal eine Tabelle mit 100.000 Datensätzen anlegen und folgende Ergebnisse vergleichen

Quellcode

EXPLAIN ANALYZE SELECT A.spalte, B.spalte FROM tabelle A, tabelle B WHERE A.spalte2 = B.spalte2;
EXPLAIN ANALYZE SELECT A.spalte, B.spalte FROM tabelle A JOIN tabelle B ON (A.spalte2 = B.spalte2);

In der Vorlesung wurde das mit einer Studentendatenbank gemacht (Die Anzahl der Datensätze weiß ich leider nicht mehr). Aber die Ausführungszeit hat sich tatsächlich etwa um den Faktor 1.000 unterschieden.

Bei DBMS Systemen wie denen von Oracle laufen die SELECTs erst durch einen QueryOptimizer. Da passiert das nicht. Ich könnte mir auch vorstellen, dass MySQL soetwas ähnliches besitzt, aber man sollte es besser gleich "richtig" machen.

Problem mit JOINs

Problem mit JOINs

Quellcode

Quellcode

Quellcode

Teilen

Tags