Die Attribut-Extraktion überträgt Daten aus einem Quelldatensatz in ein vordefiniertes Zielschema mithilfe eines KI-Sprachmodells (OpenAI / Azure OpenAI). Sie eignet sich besonders dann, wenn Quell- und Zielstruktur unterschiedliche Attributnamen verwenden oder wenn die Zuordnung inhaltlich interpretiert werden muss.
Voraussetzung: Es muss ein OPENAI_PROVIDER mit dem Anwendungsfall Attributextraktion konfiguriert sein.
1. Attribut-Extraktion anlegen
Die Operation wird wie jede andere Flow-Operation per Drag & Drop aus dem grafischen Flow-Editor auf die Editor-Oberfläche gezogen und mit einer Datenquelle verbunden.
2. Attribut-Extraktion konfigurieren
Basis
| Feld | Beschreibung |
|---|---|
| Name | Bezeichnung der Operation |
| Zielschema | Das Schema, das die Zielattribute mit ihren Schlüsseln, Beschreibungen und optionalen Fixwerten definiert |
| Quellattribute | Optionale Einschränkung: Nur die angegebenen Attribute aus dem Quelldatensatz werden an die KI übergeben. Leer lassen, um alle Attribute zu übergeben |
| Quellattribute beibehalten (Präfix) | Wird ein Präfix angegeben, werden alle Quellattribute zusätzlich unter <Präfix>_<Attributname> im Ergebnisdatensatz mitgeliefert |
| Prompt | Optionales Handlebars-Template zur Steuerung der KI-Anfrage. Leer lassen, um den systemweiten Standardprompt zu verwenden |
Wie die KI das Zielschema nutzt
Für jedes Attribut im Zielschema werden folgende Felder an die KI übergeben:
key– der Zielattributschlüsseldescription– Name oder Beschreibung des Attributs (der längere der beiden Texte wird verwendet)defaultValue– falls gesetzt, wird dieser Wert als Hinweis an die KI übergebenfixedValues– falls gesetzt, darf die KI nur Werte aus dieser Liste verwenden
3. Ausführung
Nach der Konfiguration wird die Operation über den Button Attribute extrahieren gestartet. Die KI verarbeitet jeden Datensatz der Quelle einzeln und erzeugt einen Ausgabedatensatz mit den Zielattributen.
Im Header der Ausführungskarte wird der aktuelle GPT-Status des konfigurierten Providers angezeigt:
| Status | Bedeutung |
|---|---|
| verfügbar | Der Provider ist bereit |
| Rate Limit aktiv | Das Anfrage-Kontingent ist ausgeschöpft, Reset in X Sekunden |
4. Ergebnis
Der Ausgabedatensatz enthält die vom Zielschema definierten Attribute, befüllt mit den aus dem Quelldatensatz extrahierten Werten. Attribute, für die kein passender Wert gefunden wurde, können leer oder mit dem defaultValue belegt sein.
Falls Quellattribute beibehalten konfiguriert wurde, sind zusätzlich alle Originalattribute unter dem angegebenen Präfix im Ergebnis enthalten.
5. Hinweise
- Die KI-Verarbeitung erfolgt pro Datensatz sequenziell. Bei großen Datenmengen und aktiven Rate Limits wartet die Operation automatisch bis das Kontingent wieder verfügbar ist.
- Ist kein OPENAI_PROVIDER mit dem Anwendungsfall Attributextraktion konfiguriert, schlägt die Ausführung mit einem entsprechenden Fehler fehl.
- Der GPT-Status im UI zeigt den serverseitig beobachteten Zustand seit dem letzten Backend-Start — nach einem Neustart ist der Status initial immer „verfügbar“.