In der Separation können Daten umstrukturiert werden. Dieses Umbauen erzeugt einen neuen Datensatz der anders als der ursprüngliche aufgebaut ist. Um die Separation zu konfigurieren, stehen 2 Tabs zur Verfügung, Basis enthält die grundlegenden Werte, auf Einstellungen werden die zu separierenden Spalten ausgewählt. Aus diesen gewählten Spalten werden die neuen Zeilen generiert. Werden keine Attribute in den Einstellungen ausgewählt wird der Datensatz unverändert übernommen.

Hinweis: Die Separation entspricht der Pivot-Funktion in Excel.

Zum besseren Verständnis ein Beispiel:

Die Ausgangstabelle:

ID Bild1 Bild2 Bild3 Typ
1 hund1.jpg hund1.jpg hund3.jpg Hund
2 katze1.jpg Katze
3 esel1.jpg esel2.jpg esel3.jpg Esel
4 ente1.jpg ente2.jpg Ente

In den Spalten Bild1-3 sind Namen von Bildern abgelegt, insgesamt 9. Es gibt auch einzelne leere Felder, z.B. sind Bild2 und Bild3 beim 2ten Datensatz nicht belegt.

Nun ist die Anforderung für jedes Bild aus den Spalten Bild1-3 einen eigenen Datensatz(Zeile) zu generieren. Als Ergebnis wird ein Datensatz mit 9 Einträgen erwartet, für jedes vorhandene Bild einen.

Dazu vergeben wir auf dem Reiter ‘Basis’ einen Namen und nennen das Ziel-Attribut ‘Bild’. Quell-Attribut bleibt leer. Auf dem Reiter ‘Einstellungen’ müssen die Attribute/Spaltennamen Bild1, Bild2 und Bild3 nach rechts geschoben werden, diese sollen “umgebaut” werden.

Als Ergebnis entsteht, nach dem Ausführen, folgende Tabelle:

Bild ID Typ
hund1.jpg 1 Hund
hund2.jpg 1 Hund
hund3.jpg 1 Hund
katze1.jpg 2 Katze
esel1.jpg 3 Esel
esel2.jpg 3 Esel
esel3.jpg 3 Esel
ente1.jpg 4 Ente
ente2.jpg 4 Ente

Wie erwartet, es gibt 9 Datensätze, jedes Bild ist nun in einer Zeile. ‘ID’ und ‘Typ’ wurden übernommen. Allerdings gibt es keine Information darüber, aus welcher Spalte der erzeugte Wert stammt. Bei ‘hund1.jpg’ gibt es keine Information das der Eintrag ursprünglich aus der Spalte ‘Bild1’ kommt.

Um diese Information in den neuen Datensatz zu bekommen, muss auf dem Basis-Tab das Feld Quell-Attribut ausgefüllt werden, in diesem Fall ‘Bild-Quell-Spalte’.

Nach einem weiteren Ausführen der Separation ergibt sich folgendes Ergebnis:

Bild ID Typ Bild-Quell-Spalte
hund1.jpg 1 Hund Bild1
hund2.jpg 1 Hund Bild2
hund3.jpg 1 Hund Bild3
katze1.jpg 2 Katze Bild1
esel1.jpg 3 Esel Bild1
esel2.jpg 3 Esel Bild2
esel3.jpg 3 Esel Bild3
ente1.jpg 4 Ente Bild2
ente2.jpg 4 Ente Bild3

In der ‘Bild-Quell-Spalte’ wird nun die Herkunft der Zeile genannt.

Sollen auch leere Felder im Ziel Datensatz erscheinen kommt der Schalter ‘Leere Felder übernehmen’ ins Spiel. Die Einstellungen bleiben wie im vorherigen Beispiel, zusätzlich wird ‘Leere Felder übernehmen’ gesetzt.

Durch das Ausführen der Separation ergibt sich diese Tabelle:

Bild ID Typ Bild-Quell-Spalte
hund1.jpg 1 Hund Bild1
hund2.jpg 1 Hund Bild2
hund3.jpg 1 Hund Bild3
katze1.jpg 2 Katze Bild1
2 Katze Bild2
2 Katze Bild3
esel1.jpg 3 Esel Bild1
esel2.jpg 3 Esel Bild2
esel3.jpg 3 Esel Bild3
4 Ente Bild1
ente1.jpg 4 Ente Bild2
ente2.jpg 4 Ente Bild3

Die 12 entstandenen Datensätze enthalten jetzt auch Zeilen für nicht vorhandene Bild-Einträge. Der 2te und 3te Eintrag beim ‘Typ’ Katze unterscheidet sich nur in der ‘Bild-Quell-Spalte’. Fällt also die ‘Bild-Quell-Spalte’ weg, würden zwei identische Datensätze entstehen.

In diesem Fall entfernt Chioro die Duplikate. Wenn also auf dem Tab ‘Basis’ der Eintrag ‘Quell-Attribut’ fehlt und gleichzeitig ‘Leere Felder übernehmen’ gesetzt ist, kommt folgende Tabelle heraus:

Bild ID Typ
hund1.jpg 1 Hund
hund2.jpg 1 Hund
hund3.jpg 1 Hund
katze1.jpg 2 Katze
2 Katze
esel1.jpg 3 Esel
esel2.jpg 3 Esel
esel3.jpg 3 Esel
4 Ente
ente1.jpg 4 Ente
ente2.jpg 4 Ente

Bei der Katze wären 2 identische Zeilen entstanden, deshalb sind im Ergebnis nur 11 Zeilen/Datensätze.