Aktivität „Snowflake Merge“
Einführung
Eine Snowflake -Merge-Aktivität unter Verwendung ihrer Snowflake-Verbindung, fügt eine CSV-Datei mit Tabellendaten in Snowflake ein oder aktualisiert sie und soll als Ziel für die Verwendung von Daten in einem Operation verwendet werden. Die Snowflake-Aktivität Merge unterstützt nicht das Löschen eines vorhandenen Datensatzes.
Notiz
Die Snowflake Aktivität Merge ähnelt einer Upsert-Aktivität, wie sie in anderen Konnektoren verwendet wird.
Erstellen einer Snowflake Merge-Aktivität
Eine Instanz einer Snowflake Merge-Aktivität wird aus einer Snowflake-Verbindung erstellt mithilfe des Aktivitätstyps Merge.
Um eine Instanz einer Aktivität zu erstellen, ziehen Sie den Aktivitätstyp auf die Design-Canvas oder kopieren Sie den Aktivitätstyp und fügen Sie ihn auf der Design-Canvas ein. Weitere Informationen finden Sie unter Erstellen einer Aktivitätsinstanz in Komponentenwiederverwendung.
Eine vorhandene Snowflake Merge-Aktivität kann von diesen Orten aus bearbeitet werden:
- Die Design-Canvas (siehe Aktionsmenü in Entwurfsfläche).
- Die Tab Komponenten des Projektbereichs (siehe Aktionsmenü im Projektbereich Tab Komponenten).
Konfigurieren einer Snowflake Merge-Aktivität
Befolgen Sie diese Schritte, um eine Snowflake -Merge-Aktivität zu konfigurieren:
-
Schritt 1: Geben Sie einen Namen ein und wählen Sie eine Tabelle aus
Geben Sie einen Namen für die Aktivität ein und wählen Sie eine Tabelle aus. -
Schritt 2: Zusammenführungsschlüssel auswählen
Geben Sie die Spalten an, die für Zusammenführungsschlüssel verwendet werden sollen. -
Schritt 3: Wählen Sie einen Ansatz
Für das Zusammenführen von Daten in Snowflake werden verschiedene Ansätze unterstützt. Wählen Sie entweder Direktes Mapping oder Stage-File. Wenn Sie den Stage-File-Ansatz verwenden, können Sie entweder die Optionen Vorhandenes Stage verwenden oder Temporäres Stage verwenden auswählen. -
Schritt 4: Überprüfen Sie die Datenschemata
Die vom Endpoint generierten Anforderungs- und Antwortschemata werden angezeigt. Die angezeigten Schemata hängen vom im vorherigen Schritt angegebenen Ansatz ab.
Schritt 1: Geben Sie einen Namen ein und wählen Sie eine Tabelle aus
Geben Sie in diesem Schritt einen Namen für die Aktivität ein und wählen Sie eine Tabelle aus. Jedes Benutzeroberflächenelement dieses Schritts wird unten beschrieben.
-
Name: Geben Sie einen Namen zur Identifizierung der Aktivität ein. Der Name muss für jede Snowflake Merge-Aktivität eindeutig sein und darf keine Schrägstriche enthalten
/
oder Doppelpunkte:
. -
Tabelle auswählen: In diesem Abschnitt werden die im Snowflake Endpoint verfügbaren Tabellen angezeigt. Beim erneuten Öffnen einer vorhandenen Aktivitätskonfiguration wird nur die ausgewählte Tabelle angezeigt, anstatt die gesamte Tabellenliste neu zu laden.
-
Ausgewählte Tabelle: Nachdem eine Tabelle ausgewählt wurde, wird sie hier aufgelistet.
-
Suchen: Geben Sie den Wert einer beliebigen Spalte in das Suchfeld ein, um die Liste der Tabellen zu filtern. Die Suche ist nicht groß- und kleinschreibungsabhängig. Wenn in der Tabelle bereits Tabellen angezeigt werden, werden die Tabellenergebnisse mit jedem Tastendruck in Echtzeit gefiltert. Um Tabellen während der Suche vom Endpoint neu zu laden, geben Sie Suchkriterien ein und aktualisieren Sie dann, wie unten beschrieben.
-
Aktualisieren: Klicken Sie auf das Aktualisierungssymbol oder das Wort Aktualisieren, um Tabellen vom Snowflake Endpoint neu zu laden. Dies kann nützlich sein, wenn Tabellen zu Snowflake hinzugefügt wurden. Diese Aktion aktualisiert alle Metadaten, die zum Erstellen der in der Konfiguration angezeigten Tabellentabelle verwendet werden.
-
Tabelle auswählen: Klicken Sie innerhalb der Tabelle irgendwo auf eine Zeile, um eine Tabelle auszuwählen. Es kann nur eine Tabelle ausgewählt werden. Die für jede Tabelle verfügbaren Informationen werden vom Snowflake Endpoint abgerufen:
-
Name: Der Name einer Tabelle.
-
Typ: Der Typ, bei dem es sich um eine Tabelle handelt.
-
Tipp
Wenn die Tabelle nicht mit verfügbaren Tabellen aufgefüllt wird, wird die Snowflake-Verbindung ist möglicherweise nicht erfolgreich. Stellen Sie sicher, dass Sie verbunden sind, indem Sie die Verbindung erneut öffnen und die Anmeldeinformationen erneut testen.
-
-
Speichern und beenden: Klicken Sie, wenn aktiviert, um die Konfiguration für diesen Schritt zu speichern und die Aktivitätskonfiguration zu schließen.
-
Weiter: Klicken Sie, um die Konfiguration für diesen Schritt vorübergehend zu speichern und mit dem nächsten Schritt fortzufahren. Die Konfiguration wird erst gespeichert, wenn Sie im letzten Schritt auf die Schaltfläche Fertig klicken.
-
Änderungen verwerfen: Klicken Sie nach dem Vornehmen von Änderungen, um die Konfiguration zu schließen, ohne die an einem Schritt vorgenommenen Änderungen zu speichern. Sie werden in einer Meldung aufgefordert, zu bestätigen, dass Sie die Änderungen verwerfen möchten.
Schritt 2: Merge-Keys auswählen
Geben Sie in diesem Schritt die Spalten an, die für Zusammenführungsschlüssel verwendet werden sollen. Jedes Benutzeroberflächenelement dieses Schritts wird unten beschrieben.
-
Zusammenführungsschlüssel: Wählen Sie die Spalten aus, die als Aktualisierungsschlüssel für die Zusammenführung verwendet werden sollen.
-
Zurück: Klicken Sie hier, um die Konfiguration für diesen Schritt vorübergehend zu speichern und zum vorherigen Schritt zurückzukehren.
-
Weiter: Klicken Sie hier, um die Konfiguration für diesen Schritt vorübergehend zu speichern und mit dem nächsten Schritt fortzufahren. Die Konfiguration wird erst gespeichert, wenn Sie im letzten Schritt auf die Schaltfläche Fertig klicken.
-
Änderungen verwerfen: Klicken Sie nach dem Vornehmen von Änderungen hier, um die Konfiguration zu schließen, ohne die an einem Schritt vorgenommenen Änderungen zu speichern. Sie werden in einer Meldung aufgefordert, zu bestätigen, dass Sie die Änderungen verwerfen möchten.
Schritt 3: Wählen Sie einen Ansatz
Für das Zusammenführen von Daten in Snowflake werden verschiedene Ansätze unterstützt. Wählen Sie entweder Direkte Zuordnung oder Stage-Datei. Wenn Sie den Stage-Datei-Ansatz verwenden, wählen Sie entweder die Option Vorhandene Stage verwenden oder Temporäre Stage verwenden.
- Direkter Mapping-Ansatz
- Stage-File-Ansatz (vorhandene Stage verwenden)
- Stage-File-Ansatz (temporäre Stage verwenden)
Direkter Mapping-Ansatz
-
Ansatz: Wählen Sie über das Dropdown-Menü Direkte Zuordnung aus.
-
Temporärer Bühnenname: Geben Sie einen Namen ein, der für eine temporäre Bühne bei Snowflake verwendet werden soll.
-
Zurück: Klicken Sie hier, um die Konfiguration für diesen Schritt vorübergehend zu speichern und zum vorherigen Schritt zurückzukehren.
-
Weiter: Klicken Sie hier, um die Konfiguration für diesen Schritt vorübergehend zu speichern und mit dem nächsten Schritt fortzufahren. Die Konfiguration wird erst gespeichert, wenn Sie im letzten Schritt auf die Schaltfläche Fertig klicken.
-
Änderungen verwerfen: Klicken Sie nach dem Vornehmen von Änderungen auf, um die Konfiguration zu schließen, ohne die Änderungen an Schritt. Sie werden in einer Meldung aufgefordert, zu bestätigen, dass Sie die Änderungen verwerfen möchten.
Stage-File-Ansatz (Vorhandenes Stage verwenden)
-
Vorgehensweise: Verwenden Sie das Dropdown-Menü, um Stage-File auszuwählen.
-
Phasentyp: Wählen Sie im Dropdown-Menü Vorhandene Phase verwenden aus.
-
Wählen Sie eine Phase aus: In diesem Abschnitt werden die im Snowflake Endpoint verfügbaren Phasen angezeigt. Beim erneuten Öffnen einer vorhandenen Aktivitätskonfiguration, es wird nur die ausgewählte Phase angezeigt, anstatt die gesamte Phasenliste neu zu laden.
-
Ausgewählte Phase: Nachdem eine Phase ausgewählt wurde, wird sie hier aufgelistet.
-
Suchen: Geben Sie den Wert einer beliebigen Spalte in das Suchfeld ein, um die Liste der Phasen zu filtern. Die Suche ist nicht Groß- und Kleinschreibung beachten. Wenn innerhalb der Tabelle bereits Tabellen angezeigt werden, werden die Tabellenergebnisse in Echtzeit gefiltert mit jedem Tastendruck. Um Tabellen beim Suchen vom Endpoint neu zu laden, geben Sie Suchkriterien ein und aktualisieren Sie dann, wie unten beschrieben.
-
Aktualisieren: Klicken Sie auf das Aktualisierungssymbol oder das Wort Aktualisieren, um Tabellen vom Snowflake Endpoint neu laden. Dies kann nützlich sein, wenn Sie kürzlich Folgendes hinzugefügt haben: Tabellen in Snowflake. Diese Aktion aktualisiert alle Metadaten, die zum Erstellen der Tabelle der in der Konfiguration angezeigten Tabellen.
-
Auswahl einer Phase: Klicken Sie in der Tabelle auf eine beliebige Stelle in einer Zeile, um eine Phase auszuwählen. Es kann nur eine Phase ausgewählt. Die für jede Phase verfügbaren Informationen werden vom Snowflake Endpoint abgerufen:
-
Name: Der Künstlername aus Snowflake.
-
Typ: Der Phasentyp von Snowflake. Informationen zu den Unterschieden zwischen internen und externen Phasen finden Sie in der Snowflake-Dokumentation zum Erstellen von Phasen.
-
Tipp
Wenn die Tabelle nicht mit verfügbaren Phasen gefüllt ist, wird die Snowflake-Verbindung ist möglicherweise nicht erfolgreich. Stellen Sie sicher, dass Sie verbunden sind, indem Sie die Verbindung erneut öffnen und die Anmeldeinformationen erneut testen.
-
-
Zurück: Klicken Sie hier, um die Konfiguration für diesen Schritt vorübergehend zu speichern und zum vorherigen Schritt zurückzukehren.
-
Weiter: Klicken Sie hier, um die Konfiguration für diesen Schritt vorübergehend zu speichern und mit dem nächsten Schritt fortzufahren. Die Konfiguration wird erst gespeichert, wenn Sie im letzten Schritt auf die Schaltfläche Fertig klicken.
-
Änderungen verwerfen: Klicken Sie nach dem Vornehmen von Änderungen hier, um die Konfiguration zu schließen, ohne die an einem Schritt vorgenommenen Änderungen zu speichern. Sie werden in einer Meldung aufgefordert, zu bestätigen, dass Sie die Änderungen verwerfen möchten.
Stage-File-Ansatz (Temporäres Stage verwenden)
-
Vorgehensweise: Verwenden Sie das Dropdown-Menü, um Stage-File auszuwählen.
-
Phasentyp: Wählen Sie aus der Dropdown-Liste Temporäre Phase verwenden aus.
-
Temporärer Bühnenname: Geben Sie einen Namen ein, der für eine temporäre Bühne bei Snowflake verwendet werden soll.
-
Zurück: Klicken Sie hier, um die Konfiguration für diesen Schritt vorübergehend zu speichern und zum vorherigen Schritt zurückzukehren.
-
Weiter: Klicken Sie hier, um die Konfiguration für diesen Schritt vorübergehend zu speichern und mit dem nächsten Schritt fortzufahren. Die Konfiguration wird erst gespeichert, wenn Sie im letzten Schritt auf die Schaltfläche Fertig klicken.
-
Änderungen verwerfen: Klicken Sie nach dem Vornehmen von Änderungen auf, um die Konfiguration zu schließen, ohne die Änderungen an Schritt. Sie werden in einer Meldung aufgefordert, zu bestätigen, dass Sie die Änderungen verwerfen möchten.
Schritt 4: Überprüfen der Datenschemata
Die vom Endpoint generierten Anforderungs- und Antwortschemata werden angezeigt. Die angezeigten Schemata hängen vom Ansatz ab, der im vorherigen Schritt angegeben wurde.
Diese Unterabschnitte beschreiben die Anforderungs- und Antwortstrukturen für jeden Ansatz:
Diese Aktionen sind bei jedem Ansatz verfügbar:
-
Datenschemata: Diese Datenschemata werden von benachbarten Transformations übernommen und beim Transformation erneut angezeigt.
Notiz
Die in einer Transformation bereitgestellten Daten haben Vorrang vor der Aktivitätskonfiguration.
Der Snowflake-Konnektor verwendet Version 3.19.0 des Snowflake JDBC-Treibers und die Snowflake SQL-Befehle. Informationen zu den Schema und -feldern finden Sie in der API -Dokumentation.
-
Aktualisieren: Klicken Sie auf das Aktualisierungssymbol oder das Wort Aktualisieren, um Schemas vom Endpoint neu generieren. Diese Aktion generiert das Schema auch an anderen Stellen im gesamten das Projekt, in dem auf dasselbe Schema verwiesen wird, beispielsweise in einer angrenzenden Transformation.
-
Zurück: Klicken Sie hier, um die Konfiguration für diesen Schritt vorübergehend zu speichern und zum vorherigen Schritt zurückzukehren.
-
Fertig: Klicken Sie, um die Konfiguration für alle Schritte zu speichern und die Aktivitätskonfiguration zu schließen.
-
Änderungen verwerfen: Klicken Sie nach dem Vornehmen von Änderungen auf, um die Konfiguration zu schließen, ohne die Änderungen an Schritt. Sie werden in einer Meldung aufgefordert, zu bestätigen, dass Sie die Änderungen verwerfen möchten.
Direkter Mapping-Ansatz
Dies sind die Schema, die im Beispiel Screenshot oben sichtbar sind:
-
Anfrage
Schemafeld/-knoten anfordern Hinweise updateRequest
Knoten der Zusammenführungsanforderung. _ table
_Knoten, der den Tabellennamen NAME anzeigt. item
Knoten des Artikels. column_A
Wert für den ersten Spaltennamen, COLOR. column_B
Wert für den zweiten Spaltennamen, FLOWER. . . .
Werte für nachfolgende Tabellenspalten. -
Antwort
Antwortschemafeld/-knoten Hinweise mergeResponse
Knoten der Merge-Antwort. noOfRowsUpdated
Anzahl der Zeilen aktualisiert. noOfRowsInserted
Anzahl der eingefügten Zeilen. errors
Knoten der Fehler. item
Knoten der Fehlerelemente. errorMessage
Fehlermeldung für das Fehlerelement.
Stage File-Ansatz
Dies sind die Schema, die im Beispiel Screenshot oben sichtbar sind:
-
Anfrage
Schemafeld/-knoten anfordern Hinweise mergeRequest
Knoten der Zusammenführungsanforderung. stageName
Pfad oder Präfix, unter dem die Daten auf die Snowflake Bühne hochgeladen werden. fileContent
Datendateiinhalt im CSV-Format, der zur Aktualisierung in der Snowflake-Tabelle bereitgestellt werden soll. destPrefix
Zieldateipräfix, das in der Snowflake-Phase verwendet werden soll. destFileName
Zieldateiname, der in der Snowflake-Phase verwendet werden soll. Wichtig
Wenn Vorhandene Phase verwenden ausgewählt ist und der Typ der ausgewählten Phase extern ist,
stageName
UndfileContent
sind vom Schema ausgeschlossen.Informationen zu den Unterschieden zwischen internen und externen Stages finden Sie in der Snowflake-Dokumentation zum Erstellen von Stages.
-
Antwort
Antwortschemafeld/-knoten Hinweise mergeResponse
Knoten der Merge-Antwort. noOfRowsUpdated
Anzahl der Zeilen aktualisiert. noOfRowsInserted
Anzahl der eingefügten Zeilen. errors
Knoten der Fehler. item
Knoten der Fehlerelemente. errorMessage
Fehlermeldung für das Fehlerelement.
Nächste Schritte
Nachdem Sie eine Snowflake -Merge-Aktivität konfiguriert haben, schließen Sie die Konfiguration des Operation ab, indem Sie andere Aktivitäten, Transformations oder Scripts als Operation hinzufügen und konfigurieren. Sie können auch die Operation konfigurieren, die die Möglichkeit umfassen, Vorgänge zu verketten, die sich im selben oder in unterschiedlichen Workflows befinden.
Auf Menüaktionen für eine Aktivität kann über den Projektbereich und die Design-Canvas zugegriffen werden. Weitere Informationen finden Sie unter Aktionsmenü“ in Connector-Grundlagen.
Snowflake Merge-Aktivitäten können als Ziel mit diesen Operation verwendet werden:
- Transformation
- Zwei-Transformationsmuster (als erstes oder zweites Ziel)
Um die Aktivität mit Skriptfunktionen zu verwenden, schreiben Sie die Daten an einen temporären Speicherort und verwenden Sie dann diesen temporären Speicherort in der Skriptfunktion.
Wenn Sie bereit sind, einsetzen und ausführen den Operation und validieren Sie das Verhalten durch Überprüfen der Operation.