Amazon Redshift Copy-Aktivität

Einführung

Eine Amazon Redshift Copy-Aktivität, die ihre Amazon Redshift-Verbindung verwendet, fügt Datensätze in eine Tabelle in Amazon Redshift ein und ist als Ziel gedacht, um Daten in einem Vorgang zu konsumieren.

Erstellen einer Amazon Redshift Copy-Aktivität

Eine Instanz einer Amazon Redshift Copy-Aktivität wird aus einer Amazon Redshift-Verbindung unter Verwendung des Copy-Aktivitätstyps erstellt.

Um eine Instanz einer Aktivität zu erstellen, ziehen Sie den Aktivitätstyp auf die Entwurfsfläche oder kopieren Sie den Aktivitätstyp und fügen Sie ihn auf der Entwurfsfläche ein. Weitere Einzelheiten finden Sie unter Erstellen einer Aktivitäts- oder Toolinstanz in Komponentenwiederverwendung.

Eine vorhandene Amazon Redshift Copy-Aktivität kann von diesen Orten aus bearbeitet werden:

Die Entwurfsfläche (siehe Komponentenaktionsmenü in Entwurfsfläche).
Der Komponenten-Tab im Projektbereich (siehe Komponentenaktionsmenü in Projektbereich Komponenten-Tab).

Konfigurieren einer Amazon Redshift Copy-Aktivität

Befolgen Sie diese Schritte, um eine Amazon Redshift Copy-Aktivität zu konfigurieren:

Schritt 1: Geben Sie einen Namen ein und wählen Sie ein Schema aus
Geben Sie einen Namen für die Aktivität ein und wählen Sie ein Schema aus.
Schritt 2: Wählen Sie eine Tabelle aus
Wählen Sie die Tabelle aus, die den Datensatz enthält, der kopiert werden soll.
Schritt 3: Geben Sie die Einstellungen an
Geben Sie die Einstellungen für die zu kopierenden Datensätze an.
Schritt 4: Überprüfen Sie die Datenschemas
Alle Anforderungs- oder Antwortschemas, die von dem Endpunkt generiert wurden, werden angezeigt.

Schritt 1: Geben Sie einen Namen ein und wählen Sie ein Schema

In diesem Schritt geben Sie einen Namen für die Aktivität ein und wählen ein Schema aus. Jedes Benutzeroberflächenelement dieses Schrittes wird im Folgenden beschrieben.

Amazon Redshift Copy-Aktivitätskonfiguration Schritt 1

Name: Geben Sie einen Namen ein, um die Aktivität zu identifizieren. Der Name muss für jede Amazon Redshift Copy-Aktivität eindeutig sein und darf keine Schrägstriche (/) oder Doppelpunkte (:) enthalten.
Schema auswählen: In diesem Abschnitt werden die in der Amazon Redshift-Endpunkt verfügbaren Schemata angezeigt. Beim Wiederöffnen einer vorhandenen Aktivitätskonfiguration wird nur das ausgewählte Schema angezeigt, anstatt die gesamte Schema-Liste neu zu laden.
- Ausgewählter Schema-Name: Nachdem ein Schema ausgewählt wurde, wird es hier aufgelistet.
- Suche: Geben Sie den Wert einer beliebigen Spalte in das Suchfeld ein, um die Liste der Schemata zu filtern. Die Suche ist nicht groß-/kleinschreibungsempfindlich. Wenn Schemata bereits in der Tabelle angezeigt werden, werden die Tabellenergebnisse in Echtzeit mit jedem Tastendruck gefiltert. Um Schemata vom Endpunkt beim Suchen neu zu laden, geben Sie Suchkriterien ein und aktualisieren Sie dann, wie unten beschrieben.
- Aktualisieren: Klicken Sie auf das Aktualisierungssymbol oder das Wort Aktualisieren, um Schemata vom Amazon Redshift-Endpunkt neu zu laden. Dies kann nützlich sein, wenn Schemata zu Amazon Redshift hinzugefügt wurden. Diese Aktion aktualisiert alle Metadaten, die zum Erstellen der in der Konfiguration angezeigten Schema-Tabelle verwendet werden.
- Schema auswählen: Klicken Sie innerhalb der Tabelle auf eine beliebige Stelle in einer Zeile, um ein Schema auszuwählen. Es kann nur ein Schema ausgewählt werden. Die Informationen, die für jedes Schema verfügbar sind, werden vom Amazon Redshift-Endpunkt abgerufen:
  - Schema: Der Name des Amazon Redshift-Schemas.
Tipp

Wenn die Tabelle nicht mit verfügbaren Schemata gefüllt wird, könnte die Amazon Redshift-Verbindung nicht erfolgreich sein. Stellen Sie sicher, dass Sie verbunden sind, indem Sie die Verbindung erneut öffnen und die Anmeldeinformationen erneut testen.
Speichern & Beenden: Wenn aktiviert, klicken Sie, um die Konfiguration für diesen Schritt zu speichern und die Aktivitätskonfiguration zu schließen.
Weiter: Klicken Sie, um die Konfiguration für diesen Schritt vorübergehend zu speichern und zum nächsten Schritt fortzufahren. Die Konfiguration wird nicht gespeichert, bis Sie die Schaltfläche Fertig im letzten Schritt klicken.
Änderungen verwerfen: Nach Änderungen klicken Sie, um die Konfiguration zu schließen, ohne die vorgenommenen Änderungen an einem Schritt zu speichern. Eine Nachricht fordert Sie auf, zu bestätigen, dass Sie die Änderungen verwerfen möchten.

Schritt 2: Wählen Sie eine Tabelle

In diesem Schritt wählen Sie eine Tabelle aus. Jedes Benutzeroberflächenelement dieses Schrittes wird im Folgenden beschrieben.

Amazon Redshift Copy-Aktivitätskonfiguration Schritt 2

Tabelle auswählen: In diesem Abschnitt werden die in der Amazon Redshift-Endpunkt verfügbaren Tabellen angezeigt. Beim erneuten Öffnen einer vorhandenen Aktivitätskonfiguration wird nur die ausgewählte Tabelle angezeigt, anstatt die gesamte Tabellenliste neu zu laden.
- Ausgewählter Schema-Name: Der im vorherigen Schritt ausgewählte Schema-Name wird hier aufgeführt.
- Tabellenname auswählen: Nachdem eine Tabelle ausgewählt wurde, wird sie hier aufgeführt.
- Suche: Geben Sie den Wert einer beliebigen Spalte in das Suchfeld ein, um die Liste der Tabellen zu filtern. Die Suche ist nicht groß-/kleinschreibungsempfindlich. Wenn Tabellen bereits innerhalb der Tabelle angezeigt werden, werden die Tabellenergebnisse in Echtzeit mit jedem Tastendruck gefiltert. Um Tabellen vom Endpunkt beim Suchen neu zu laden, geben Sie Suchkriterien ein und aktualisieren Sie dann, wie unten beschrieben.
- Aktualisieren: Klicken Sie auf das Aktualisierungssymbol oder das Wort Aktualisieren, um Tabellen vom Amazon Redshift-Endpunkt neu zu laden. Dies kann nützlich sein, wenn Tabellen zu Amazon Redshift hinzugefügt wurden. Diese Aktion aktualisiert alle Metadaten, die zum Erstellen der in der Konfiguration angezeigten Tabelle von Tabellen verwendet werden.
- Tabelle auswählen: Klicken Sie innerhalb der Tabelle auf eine beliebige Zeile, um eine Tabelle auszuwählen. Es kann nur eine Tabelle ausgewählt werden. Die Informationen, die für jede Tabelle verfügbar sind, werden vom Amazon Redshift-Endpunkt abgerufen:
  - Tabellenname: Der Name der Amazon Redshift-Tabelle.
  - Schema: Der Name des Amazon Redshift-Schemas.
  - Katalog: Der Name des Amazon Redshift-Katalogs.
Hinweis

Wenn die Tabelle nicht mit verfügbaren Tabellen gefüllt wird, könnte die Amazon Redshift-Verbindung nicht erfolgreich sein. Stellen Sie sicher, dass Sie verbunden sind, indem Sie die Verbindung erneut öffnen und die Anmeldeinformationen erneut testen.
Zurück: Klicken Sie, um die Konfiguration für diesen Schritt vorübergehend zu speichern und zum vorherigen Schritt zurückzukehren.
Weiter: Klicken Sie, um die Konfiguration für diesen Schritt vorübergehend zu speichern und zum nächsten Schritt fortzufahren. Die Konfiguration wird nicht gespeichert, bis Sie die Schaltfläche Fertig im letzten Schritt klicken.
Änderungen verwerfen: Nachdem Sie Änderungen vorgenommen haben, klicken Sie, um die Konfiguration zu schließen, ohne die vorgenommenen Änderungen zu speichern. Eine Nachricht fragt Sie, ob Sie die Änderungen wirklich verwerfen möchten.

Schritt 3: Einstellungen angeben

In diesem Schritt geben Sie die Einstellungen für den gewünschten AWS-Bucket an. Jedes Benutzeroberflächenelement dieses Schrittes wird unten beschrieben.

Amazon Redshift Copy-Aktivitätskonfiguration Schritt 3

Hinweis

Felder mit einem Variablen-Icon unterstützen die Verwendung von globalen Variablen, Projektvariablen und Jitterbit-Variablen. Beginnen Sie entweder, indem Sie eine öffnende eckige Klammer [ in das Feld eingeben, oder indem Sie auf das Variablen-Icon klicken, um eine Liste der vorhandenen Variablen anzuzeigen, aus der Sie auswählen können.

Ansatz: Geben Sie den Ansatz für die Anmeldeinformationen an, der für den AWS-Bucket verwendet werden soll, entweder rollenbasiert oder schlüsselbasiert:.
- Rollenbasiert: Wenn der rollenbasierte Ansatz zum Zugriff auf den AWS-Bucket verwendet wird:
  - IAM-Rollenanmeldeinformationen: Geben Sie die IAM-Rolle ein, die mit den Anmeldeinformationen verknüpft ist.
- Schlüsselbasiert: Wenn der schlüsselbasierte Ansatz zum Zugriff auf den AWS-Bucket verwendet wird:
  - AWS-Zugangs-Schlüssel-ID: Geben Sie die AWS-Zugangs-Schlüssel-ID ein.
  - AWS-Geheimer Zugangs-Schlüssel: Geben Sie den AWS-geheimen Zugangs-Schlüssel ein.
Von: Geben Sie den Amazon-Bucket ein, von dem die Daten kopiert werden sollen.
Region: Geben Sie die Amazon-Region des Buckets ein, von dem die Daten kopiert werden sollen.
Trennzeichen: Geben Sie das Trennzeichen ein, das beim Kopieren der Daten verwendet werden soll.
Zurück: Klicken Sie, um die Konfiguration für diesen Schritt vorübergehend zu speichern und zum vorherigen Schritt zurückzukehren.
Weiter: Klicken Sie, um die Konfiguration für diesen Schritt vorübergehend zu speichern und zum nächsten Schritt fortzufahren. Die Konfiguration wird nicht gespeichert, bis Sie die Schaltfläche Fertig im letzten Schritt klicken.
Änderungen verwerfen: Nachdem Sie Änderungen vorgenommen haben, klicken Sie, um die Konfiguration zu schließen, ohne die Änderungen an einem Schritt zu speichern. Eine Nachricht fragt Sie, ob Sie die Änderungen wirklich verwerfen möchten.

Schritt 4: Überprüfen der Datenschemas

Alle Anforderungs- oder Antwortschemas, die von der Schnittstelle generiert werden, werden angezeigt. Jedes Benutzeroberflächenelement dieses Schrittes wird im Folgenden beschrieben.

Amazon Redshift Copy activity configuration step 4

Datenschemas: Diese Datenschemas werden von angrenzenden Transformationen übernommen und während der Transformationszuordnung erneut angezeigt.

Hinweis

Daten, die in einer Transformation bereitgestellt werden, haben Vorrang vor der Aktivitätskonfiguration.

Der Amazon Redshift-Connector verwendet den Amazon Redshift JDBC-Treiber Version 2.1.0.28 und Amazon Redshift SQL-Befehle. Weitere Informationen finden Sie in der Amazon Redshift-Dokumentation und der Dokumentation zur Amazon Redshift-Systemübersicht.

Die Anforderungs- und Antwortdatenschemata bestehen aus diesen Knoten und Feldern:

Anforderung

Anforderungs-Schema Feld/Knoten	Hinweise
`accounts`	Die Tabelle, die ausgewählt wurde, in die die Datensätze kopiert werden sollen
`approach`	Der Ansatz, der in Schritt 3: Einstellungen angeben ausgewählt wurde
`delimiter`	Getrennte Bezeichner beginnen und enden mit doppelten Anführungszeichen (")
`from`	Der Amazon Redshift-Bucket, von dem die Datensätze kopiert werden sollen
`awsSecretAccessKey`	Geheimer Zugriffsschlüssel aus dem angegebenen AWS-Konto
`awsAccessKeyId`	Zugriffsschlüssel-ID aus dem angegebenen AWS-Konto
`iamRole`	IAM-Rolle aus dem angegebenen AWS-Konto
`region`	Region für das angegebene AWS-Konto

Antwort

Antwort-Schema Feld/Knoten	Hinweise
`accounts`	Knoten, der die in Schritt 2: Eine Tabelle auswählen ausgewählte Tabelle darstellt
`desc`	Zeichenfolge, die die Anzahl der erfolgreich kopierten Zeilen enthält
`error`	Zeichenfolgenmeldung, die einen Fehler beschreibt, falls aufgetreten
`status`	Boolean, der Erfolg oder Misserfolg anzeigt

Aktualisieren: Klicken Sie auf das Aktualisierungssymbol oder das Wort Aktualisieren, um Schemata vom Amazon Redshift-Endpunkt neu zu generieren. Diese Aktion regeneriert auch ein Schema an anderen Stellen im Projekt, an denen dasselbe Schema referenziert wird, wie z. B. in einer benachbarten Transformation.
Zurück: Klicken Sie, um die Konfiguration für diesen Schritt vorübergehend zu speichern und zum vorherigen Schritt zurückzukehren.
Fertig: Klicken Sie, um die Konfiguration für alle Schritte zu speichern und die Aktivitätskonfiguration zu schließen.
Änderungen verwerfen: Nach Änderungen klicken Sie, um die Konfiguration zu schließen, ohne die an einem Schritt vorgenommenen Änderungen zu speichern. Eine Nachricht fordert Sie auf, zu bestätigen, dass Sie die Änderungen verwerfen möchten.

Nächste Schritte

Nachdem Sie eine Amazon Redshift Copy-Aktivität konfiguriert haben, vervollständigen Sie die Konfiguration des Vorgangs, indem Sie andere Aktivitäten oder Werkzeuge als Vorgangsschritte hinzufügen und konfigurieren. Sie können auch die Betriebseinstellungen konfigurieren, die die Möglichkeit umfassen, Vorgänge zusammenzufassen, die sich in denselben oder unterschiedlichen Workflows befinden.

Menüaktionen für eine Aktivität sind im Projektbereich und auf der Entwurfsgrafik zugänglich. Für Details siehe Aktivitätsaktionsmenü in Connector-Grundlagen.

Amazon Redshift Copy-Aktivitäten können als Ziel mit diesen Betriebsmustern verwendet werden:

Transformationsmuster
Zwei-Transformationsmuster (als erstes oder zweites Ziel)

Um die Aktivität mit Skriptfunktionen zu verwenden, schreiben Sie die Daten an einen temporären Speicherort und verwenden Sie dann diesen temporären Speicherort in der Skriptfunktion.

Wenn Sie bereit sind, bereitstellen und ausführen Sie den Vorgang und validieren Sie das Verhalten, indem Sie die Betriebsprotokolle überprüfen.