Hier ist ein Datensatz mit Adressen zu finden: adressen_test.csv
Allerdings ist in diesem Datensatz einiges nicht in Ordnung, so steht z.B. die Hausnummer nicht immer in der korrekten Spalte, sondern manchmal auch bei der Straße dabei. Die Aufgaben beziehen sich zunächst also darauf, Ordnung in die Daten zu bekommen. Dazu ist ein Flow anzulegen, in die Datenquelle kommt die CSV und in einer folgenden Transformation sollen die folgenden Aufgaben gelöst werden.
- Straßennamen sollen allein stehen, die Hausnummer gehört in die richtige Spalte.
- Bei den Straßennamen soll str./Str. durch das ausgeschriebene straße/Straße ersetzt werden.
- Wie bei den Straßennamen, Stadt un PLZ gehören einzeln in die richtige Spalte.
- Bei den PLZ fehlt manchmal die führende Null, zu erkennen an einer vierstelligen Zahl, das soll repariert werden.
- Der Titel (Dr. Prof. usw) steht zum Teil beim Vor- oder Nachnamen. Das gehört natürlich in die richtige Spalte.
- Bei den Vor- und Nachnamen gibt es ein Problem mit der Groß- und Kleinschreibung (z.B. sCHmidt). Das muss korrigiert werden.
- Die Spalte Mobil enthält Handynummern in verschiedenen Formaten. Das soll einheitlich zu Vorwahl/Nummer werden (z.B. 0177/1234567).
- Es sollen aus den Daten Adressaufkleber gedruckt werden. Dazu muss es eine Spalte geben in der die komplette Adresse in HTML steht.
Erika Mustermann
Steinstraße 19
80809 MünchenDer String der dazu benötigt wird, sieht folgendermaßen aus Erika Mustermann<br/>Steinstraße 19<br/>80809 München.Die <br/>sind Zeilenvorschübe und müssen eingefügt werden.