In der Separation können Daten umstrukturiert werden. Dieses Umbauen erzeugt einen neuen Datensatz der anders als der ursprüngliche aufgebaut ist. Um die Separation zu konfigurieren, stehen 2 Tabs zur Verfügung, Basis enthält die grundlegenden Werte, auf Einstellungen werden die zu separierenden Spalten ausgewählt. Aus diesen gewählten Spalten werden die neuen Zeilen generiert. Werden keine Attribute in den Einstellungen ausgewählt wird der Datensatz unverändert übernommen.
Hinweis: Die Separation entspricht der Pivot-Funktion in Excel.
Zum besseren Verständnis ein Beispiel:
Die Ausgangstabelle:
| ID | Bild1 | Bild2 | Bild3 | Typ |
|---|---|---|---|---|
| 1 | hund1.jpg | hund1.jpg | hund3.jpg | Hund |
| 2 | katze1.jpg | Katze | ||
| 3 | esel1.jpg | esel2.jpg | esel3.jpg | Esel |
| 4 | ente1.jpg | ente2.jpg | Ente |
In den Spalten Bild1-3 sind Namen von Bildern abgelegt, insgesamt 9. Es gibt auch einzelne leere Felder, z.B. sind Bild2 und Bild3 beim 2ten Datensatz nicht belegt.
Nun ist die Anforderung für jedes Bild aus den Spalten Bild1-3 einen eigenen Datensatz(Zeile) zu generieren. Als Ergebnis wird ein Datensatz mit 9 Einträgen erwartet, für jedes vorhandene Bild einen.
Dazu vergeben wir auf dem Reiter ‘Basis’ einen Namen und nennen das Ziel-Attribut ‘Bild’. Quell-Attribut bleibt leer. Auf dem Reiter ‘Einstellungen’ müssen die Attribute/Spaltennamen Bild1, Bild2 und Bild3 nach rechts geschoben werden, diese sollen “umgebaut” werden.
Als Ergebnis entsteht, nach dem Ausführen, folgende Tabelle:
| Bild | ID | Typ |
|---|---|---|
| hund1.jpg | 1 | Hund |
| hund2.jpg | 1 | Hund |
| hund3.jpg | 1 | Hund |
| katze1.jpg | 2 | Katze |
| esel1.jpg | 3 | Esel |
| esel2.jpg | 3 | Esel |
| esel3.jpg | 3 | Esel |
| ente1.jpg | 4 | Ente |
| ente2.jpg | 4 | Ente |
Wie erwartet, es gibt 9 Datensätze, jedes Bild ist nun in einer Zeile. ‘ID’ und ‘Typ’ wurden übernommen. Allerdings gibt es keine Information darüber, aus welcher Spalte der erzeugte Wert stammt. Bei ‘hund1.jpg’ gibt es keine Information das der Eintrag ursprünglich aus der Spalte ‘Bild1’ kommt.
Um diese Information in den neuen Datensatz zu bekommen, muss auf dem Basis-Tab das Feld Quell-Attribut ausgefüllt werden, in diesem Fall ‘Bild-Quell-Spalte’.
Nach einem weiteren Ausführen der Separation ergibt sich folgendes Ergebnis:
| Bild | ID | Typ | Bild-Quell-Spalte |
|---|---|---|---|
| hund1.jpg | 1 | Hund | Bild1 |
| hund2.jpg | 1 | Hund | Bild2 |
| hund3.jpg | 1 | Hund | Bild3 |
| katze1.jpg | 2 | Katze | Bild1 |
| esel1.jpg | 3 | Esel | Bild1 |
| esel2.jpg | 3 | Esel | Bild2 |
| esel3.jpg | 3 | Esel | Bild3 |
| ente1.jpg | 4 | Ente | Bild2 |
| ente2.jpg | 4 | Ente | Bild3 |
In der ‘Bild-Quell-Spalte’ wird nun die Herkunft der Zeile genannt.
Sollen auch leere Felder im Ziel Datensatz erscheinen kommt der Schalter ‘Leere Felder übernehmen’ ins Spiel. Die Einstellungen bleiben wie im vorherigen Beispiel, zusätzlich wird ‘Leere Felder übernehmen’ gesetzt.
Durch das Ausführen der Separation ergibt sich diese Tabelle:
| Bild | ID | Typ | Bild-Quell-Spalte |
|---|---|---|---|
| hund1.jpg | 1 | Hund | Bild1 |
| hund2.jpg | 1 | Hund | Bild2 |
| hund3.jpg | 1 | Hund | Bild3 |
| katze1.jpg | 2 | Katze | Bild1 |
| 2 | Katze | Bild2 | |
| 2 | Katze | Bild3 | |
| esel1.jpg | 3 | Esel | Bild1 |
| esel2.jpg | 3 | Esel | Bild2 |
| esel3.jpg | 3 | Esel | Bild3 |
| 4 | Ente | Bild1 | |
| ente1.jpg | 4 | Ente | Bild2 |
| ente2.jpg | 4 | Ente | Bild3 |
Die 12 entstandenen Datensätze enthalten jetzt auch Zeilen für nicht vorhandene Bild-Einträge. Der 2te und 3te Eintrag beim ‘Typ’ Katze unterscheidet sich nur in der ‘Bild-Quell-Spalte’. Fällt also die ‘Bild-Quell-Spalte’ weg, würden zwei identische Datensätze entstehen.
In diesem Fall entfernt Chioro die Duplikate. Wenn also auf dem Tab ‘Basis’ der Eintrag ‘Quell-Attribut’ fehlt und gleichzeitig ‘Leere Felder übernehmen’ gesetzt ist, kommt folgende Tabelle heraus:
| Bild | ID | Typ |
|---|---|---|
| hund1.jpg | 1 | Hund |
| hund2.jpg | 1 | Hund |
| hund3.jpg | 1 | Hund |
| katze1.jpg | 2 | Katze |
| 2 | Katze | |
| esel1.jpg | 3 | Esel |
| esel2.jpg | 3 | Esel |
| esel3.jpg | 3 | Esel |
| 4 | Ente | |
| ente1.jpg | 4 | Ente |
| ente2.jpg | 4 | Ente |
Bei der Katze wären 2 identische Zeilen entstanden, deshalb sind im Ergebnis nur 11 Zeilen/Datensätze.