Mit der Operation Diff können zwei Datensätze verglichen werden. Dabei ist ein Datensatz die Vergleichsquelle (Referenz / z.B. ein älterer Datensatz), der andere Datensatz die Hauptquelle (die aktuellen/neuen Daten). Auf vier Ausgängen werden folgende Datensätze zur Verfügung gestellt:

  • Unverändert: Daten bei denen keine Änderung erkannt wurde.
  • Geändert: Daten die in beiden Datensätzen vorhanden sind aber geändert wurden.
  • Hinzugefügt: Daten die im Referenzdatensatz noch nicht vorhanden waren.
  • Gelöscht: Daten die im Referenzdatensatz vorhanden waren und jetzt fehlen

Zu beachten: Die beiden verwendeten Datensätze müssen die gleichen Spalten/Attribute enthalten.

Zum besseren Verständnis ein Beispiel:

Die Referenztabelle (älterer Datensatz): CSV herunterladen

product_id name color price
1 Chair Red 50
2 Table Blue 120
3 Lamp White 30
4 Shelf Black 80

Die Quelltabelle (aktuelle/neue Daten): CSV herunterladen

product_id name color price
1 Chair Red 50
2 Table Blue 150
3 Lamp Green 35
5 Sofa Gray 200

Das Schlüsselattribut ist product_id. Nach dem Ausführen der Diff mit aktiviertem “Gelöschte Werte ermitteln” enthalten die vier Ausgänge folgende Daten:

Unverändert — Datensätze bei denen alle Werte in beiden Datensätzen identisch sind:

product_id name color price
1 Chair Red 50

Geändert — Datensätze die in beiden Datensätzen vorhanden sind, aber mindestens einen geänderten Wert haben:

product_id name color price
2 Table Blue 150
3 Lamp Green 35

Produkt 2 hat sich im Preis geändert (120 → 150), Produkt 3 hat sich in Farbe (White → Green) und Preis (30 → 35) geändert.

Hinzugefügt — Datensätze in der Quelle die in der Referenz nicht vorhanden sind:

product_id name color price
5 Sofa Gray 200

Gelöscht — Datensätze in der Referenz die in der Quelle nicht mehr vorhanden sind:

product_id name color price
4 Shelf Black 80

Die Konfiguration:

tags

  1. Einen Namen für die Diff vergeben
  2. Das Schlüsselattribut/Schlüsselspalte muss in beiden Datensätzen vorhanden sein und die Werte müssen einmalig sein.
  3. Die gelöschten Werte werden standardmäßig nicht ermittelt und auf dem Ausgang erscheinen keine Daten. Mit diesem Schalter wird der Ausgang aktiviert.