/ Artikel

Data-Modifying-CTEs

Mit Data-Modifying-CTEs in PostgreSQL INSERT, UPDATE und DELETE innerhalb einer WITH-Klausel kombinieren — Archivierungs-Patterns, atomares Verschieben, Audit-Logs in einem Statement. Mit allen Stolperfallen rund um Sichtbarkeit und Reihenfolge.

PostgreSQL erlaubt nicht nur SELECT in CTEs — auch INSERT, UPDATE und DELETE dürfen rein. Mit RETURNING bekommst du die betroffenen Zeilen zurück und kannst sie weiter verarbeiten. Das ergibt Patterns wie atomares Archivieren, Move-Operationen oder Audit-Logging in einem einzigen Statement — mit ein paar Eigenheiten zu Sichtbarkeit und Reihenfolge, die man kennen muss.

01 · Abschnitt

Das Grundpattern: Archivieren

Klassisches Beispiel: alte Bestellungen aus orders löschen und in orders_archive schieben — atomar.

SQL DELETE + INSERT in einem Statement

WITH archived AS (
    DELETE FROM orders
    WHERE created_at < now() - interval '2 years'
    RETURNING *
)
INSERT INTO orders_archive
SELECT * FROM archived;

Was passiert:

Der DELETE löscht die alten Zeilen aus orders und gibt sie via RETURNING * zurück.
Der INSERT schreibt sie in orders_archive.
Beides läuft in derselben Transaktion — bei einem Fehler werden beide zurückgerollt.

Das ist MOVE in einem Statement, ohne dass eine andere Transaktion zwischendurch die Daten in einem inkonsistenten Zustand sieht.

02 · Abschnitt

Audit-Log mit `UPDATE`

Wer Änderungen mit-protokollieren will:

SQL

WITH updated AS (
    UPDATE orders
    SET status = 'shipped',
        shipped_at = now()
    WHERE status = 'paid'
      AND created_at < now() - interval '1 day'
    RETURNING id, customer_id, total, now() AS event_at
)
INSERT INTO order_events (order_id, customer_id, event_type, event_at)
SELECT id, customer_id, 'shipped', event_at
FROM updated;

Erst UPDATE mit RETURNING, dann mit den zurückgegebenen Daten direkt einen Audit-Eintrag pro betroffene Zeile schreiben.

03 · Abschnitt

Mehrere Schreib-CTEs

Auch mehrere Schreib-Operationen sind erlaubt:

SQL DELETE + UPDATE + INSERT zusammen

WITH
cancelled AS (
    UPDATE orders
    SET status = 'cancelled', cancelled_at = now()
    WHERE id = ANY($1::bigint[])
    RETURNING id, customer_id, total
),
refund_items AS (
    INSERT INTO refunds (order_id, amount, requested_at)
    SELECT id, total, now()
    FROM cancelled
    RETURNING id AS refund_id, order_id
)
INSERT INTO customer_notifications (customer_id, message, created_at)
SELECT c.customer_id,
       'Bestellung ' || c.id || ' wurde storniert. Refund-ID: ' || r.refund_id,
       now()
FROM cancelled c
INNER JOIN refund_items r ON r.order_id = c.id;

Drei Schritte in einem Statement: Bestellungen stornieren, Refunds anlegen, Kunden benachrichtigen. Alles atomar.

04 · Abschnitt

Sichtbarkeit: alle Schreib-CTEs sehen denselben Snapshot

Wichtigste Eigenheit: alle Schreib-CTEs in einer Query sehen denselben konsistenten Snapshot der Daten — den Zustand bevor das Statement begann. Auch wenn ein CTE Zeilen ändert, sehen die anderen CTEs sie noch im Original-Zustand.

SQL Stolperfalle: alte Werte sichtbar

-- Annahme: products(id=1, price=100)
WITH price_update AS (
    UPDATE products SET price = 200 WHERE id = 1
    RETURNING id, price
)
SELECT
    (SELECT price FROM products WHERE id = 1) AS direct_read,
    (SELECT price FROM price_update)          AS from_cte;

Output:

SQL

 direct_read | from_cte
-------------+----------
         100 |      200

Der direct_read aus products sieht den alten Wert (100) — obwohl der UPDATE schon im selben Statement passiert ist. Erst der RETURNING-Pfad zeigt den neuen Wert.

Konsequenz: wer auf den geänderten Zustand zugreifen will, muss über RETURNING und den CTE-Namen gehen — nicht direkt aus der Tabelle nochmal lesen.

05 · Abschnitt

Reihenfolge ist nicht garantiert

Postgres garantiert nicht, in welcher Reihenfolge die Schreib-CTEs ausgeführt werden — nur dass sie alle vor dem Final-Statement laufen und atomar sind.

SQL Falsch: Reihenfolge angenommen

WITH
deleted AS (DELETE FROM tasks WHERE done RETURNING id),
inserted AS (INSERT INTO tasks_archive SELECT * FROM tasks_old)
SELECT * FROM tasks WHERE id NOT IN (SELECT id FROM deleted);

Das funktioniert, aber wer sich darauf verlässt, dass deleted definitiv vor dem äußeren SELECT läuft, hat Glück — Postgres macht's so, garantiert ist's aber durch die Snapshot-Logik (siehe oben). Auf Sichtbarkeits-Reihenfolge nie verlassen.

06 · Abschnitt

Schreib-CTEs sind immer materialisiert

Anders als lesende CTEs werden Schreib-CTEs immer materialisiert — Postgres kann sie nicht inlinen, da sie Side-Effects haben:

SQL EXPLAIN zeigt CTE-Knoten

myapp=> EXPLAIN
        WITH del AS (DELETE FROM tmp WHERE x < 10 RETURNING *)
        INSERT INTO tmp_archive SELECT * FROM del;
                          QUERY PLAN
----------------------------------------------------------
 Insert on tmp_archive
   CTE del
     ->  Delete on tmp
           ->  Seq Scan on tmp
                 Filter: (x < 10)
   ->  CTE Scan on del

Der Plan zeigt klar: CTE del ist ein eigener Knoten, der einmal ausgeführt wird.

07 · Abschnitt

Constraints und Trigger pro CTE

Trigger und Constraints feuern pro CTE, in der Reihenfolge der Tabellen-Modifikationen. Das kann unerwartete Wechselwirkungen geben:

SQL Trigger feuern getrennt

-- AFTER INSERT trigger auf orders schreibt in audit_log
-- AFTER DELETE trigger auf orders schreibt auch in audit_log

WITH
del AS (DELETE FROM orders WHERE status = 'expired' RETURNING *),
ins AS (INSERT INTO orders_archive SELECT * FROM del)
SELECT count(*) FROM del;

Resultat: Der DELETE-Trigger feuert für jede gelöschte Zeile (= Anzahl Zeilen in del). Aber INSERT INTO orders_archive löst keinen Trigger auf orders aus — es ist eine andere Tabelle. Wenn man die audit_log-Logik durchgehend will, braucht es Trigger auf orders_archive — oder einen direkten INSERT in audit_log als weiteren CTE.

08 · Abschnitt

Pattern: `UPSERT` mit Logging

SQL ON CONFLICT + Audit kombiniert

WITH upserted AS (
    INSERT INTO products (sku, name, price)
    VALUES ('SKU-100', 'Widget', 29.99)
    ON CONFLICT (sku) DO UPDATE
        SET name = EXCLUDED.name,
            price = EXCLUDED.price,
            updated_at = now()
    RETURNING id, sku, (xmax = 0) AS was_inserted
)
INSERT INTO product_log (product_id, action, logged_at)
SELECT id,
       CASE WHEN was_inserted THEN 'insert' ELSE 'update' END,
       now()
FROM upserted;

Der Trick mit xmax = 0: bei einem INSERT ist die xmax-Systemspalte 0, beim UPDATE (also Konflikt-Fall) wird sie gesetzt. So unterscheidet man im Log, was wirklich passiert ist.

09 · Abschnitt

Häufige Stolperfallen

Snapshot-Konsistenz: andere CTEs sehen den ALTEN Zustand.

Wer in einem CTE eine Zeile updated und in einem anderen CTE die Tabelle direkt liest, sieht den alten Wert — nicht den neuen. Wer den neuen Zustand braucht, muss über RETURNING und CTE-JOIN gehen, nicht erneut aus der Tabelle lesen.

Reihenfolge der Schreib-CTEs ist nicht definiert.

Postgres garantiert Atomarität, aber nicht die Ausführungs-Reihenfolge. Wenn deine Logik darauf angewiesen ist, dass CTE A vor B läuft, modelliere das über Datenfluss (B liest aus A's RETURNING) — verlasse dich nicht auf textuelle Reihenfolge.

Eine Zeile darf nicht zweimal von Schreib-CTEs getroffen werden.

WITH a AS (UPDATE t SET x=1 WHERE id=1 RETURNING *), b AS (UPDATE t SET x=2 WHERE id=1 RETURNING *) ... ist undefiniertes Verhalten — Postgres erlaubt's, aber das Resultat ist nicht spezifiziert. In der Praxis Fehler oder unerwartete Werte. Disjunkte Bedingungen verwenden.

Trigger feuern ganz normal — pro CTE.

AFTER-Trigger auf jeder Tabelle laufen, Constraints werden geprüft. Bei Foreign-Key-Constraints kann das tricky werden: ein DELETE aus Parent + INSERT in Child kann fehlschlagen, wenn die Reihenfolge nicht stimmt. DEFERRABLE Constraints helfen.

`RETURNING` nicht vergessen — sonst keine Daten weiter.

Ohne RETURNING produziert ein Schreib-CTE keine Zeilen für die nachfolgenden Verarbeitungs-Schritte. Eine sehr häufige Anfänger-Falle: WITH x AS (DELETE FROM ...) INSERT INTO archive SELECT * FROM x ohne RETURNING * führt nichts in archive ein — x ist leer.

Performance: bei sehr großen Mengen Batches besser.

Data-Modifying-CTEs sind atomar — was bei sehr großen Mengen zu langen Locks und großem WAL-Volumen führen kann. Wer Millionen Zeilen verschieben will: lieber in Batches (LIMIT 10000 + Loop) oder mit pg_partman-artigen Patterns. Atomarität hat ihren Preis.

10 · Abschnitt

Weiterführende Ressourcen

Externe Quellen

/ Weiter

Zurück zu CTEs & Rekursion

Zur Übersicht