Zum Inhalt springen

Amazon Redshift Kopieraktivität

Einführung

Eine Amazon Redshift Kopieraktivität unter Verwendung ihrer Amazon Redshift Verbindung, fügt Datensätze in eine Tabelle bei Amazon Redshift ein und ist als Ziel zum Verwenden von Daten in einer Operation vorgesehen.

Erstellen einer Amazon Redshift Kopieraktivität

Eine Instanz einer Amazon Redshift Kopieraktivität wird aus einer Amazon Redshift Verbindung erstellt mithilfe des Aktivitätstyps Kopieren.

Um eine Instanz einer Aktivität zu erstellen, ziehen Sie den Aktivitätstyp auf die Design-Canvas oder kopieren Sie den Aktivitätstyp und fügen Sie ihn auf der Design-Canvas ein. Weitere Informationen finden Sie unter Erstellen einer Aktivitätsinstanz in Komponentenwiederverwendung.

Eine vorhandene Amazon Redshift Kopieraktivität kann von diesen Orten aus bearbeitet werden:

Konfigurieren einer Amazon Redshift Kopieraktivität

Befolgen Sie diese Schritte, um eine Amazon Redshift Aktivität Kopier zu konfigurieren:

Schritt 1: Geben Sie einen Namen ein und wählen Sie ein Schema aus

Geben Sie in diesem Schritt einen Namen für die Aktivität ein und wählen Sie ein Schema aus. Jedes Benutzeroberflächenelement dieses Schritts wird unten beschrieben.

Amazon Redshift Kopieraktivität - Konfigurationsschritt 1

  • Name: Geben Sie einen Namen zur Identifizierung der Aktivität ein. Der Name muss für jede Amazon Redshift Copy-Aktivität eindeutig sein und darf keine Schrägstriche enthalten (/) oder Doppelpunkte (:).

  • Wählen Sie ein Schema aus: In diesem Abschnitt werden die im Amazon Redshift Endpoint verfügbaren Schemata angezeigt. Beim erneuten Öffnen einer vorhandenen Aktivitätskonfiguration wird nur das ausgewählte Schema angezeigt, anstatt die gesamte Schema neu zu laden.

    • Ausgewählter Schemaname: Nachdem ein Schema ausgewählt wurde, wird es hier aufgelistet.

    • Suchen: Geben Sie den Wert einer beliebigen Spalte in das Suchfeld ein, um die Liste der Schemata zu filtern. Bei der Suche wird nicht zwischen Groß- und Kleinschreibung unterschieden. Wenn in der Tabelle bereits Schemata angezeigt werden, werden die Tabellenergebnisse mit jedem Tastendruck in Echtzeit gefiltert. Um Schemata während der Suche vom Endpoint neu zu laden, geben Sie Suchkriterien ein und aktualisieren Sie dann, wie unten beschrieben.

    • Aktualisieren: Klicken Sie auf das Aktualisierungssymbol oder das Wort Aktualisieren, um Schemata vom Amazon Redshift Endpoint neu zu laden. Dies kann nützlich sein, wenn Schemata zu Amazon Redshift hinzugefügt wurden. Diese Aktion aktualisiert alle Metadaten, die zum Erstellen der in der Konfiguration angezeigten Schematabelle verwendet werden.

    • Auswählen eines Schemas: Klicken Sie in der Tabelle irgendwo auf eine Zeile, um ein Schema auszuwählen. Es kann nur ein Schema ausgewählt werden. Die für jedes Schema verfügbaren Informationen werden vom Amazon Redshift Endpoint abgerufen:

    Tipp

    Wenn die Tabelle nicht mit verfügbaren Schemas gefüllt ist, wird die Amazon Redshift Verbindung ist möglicherweise nicht erfolgreich. Stellen Sie sicher, dass Sie verbunden sind, indem Sie die Verbindung erneut öffnen und die Anmeldeinformationen erneut testen.

  • Speichern und beenden: Klicken Sie, wenn aktiviert, um die Konfiguration für diesen Schritt zu speichern und die Aktivitätskonfiguration zu schließen.

  • Weiter: Klicken Sie, um die Konfiguration für diesen Schritt vorübergehend zu speichern und mit dem nächsten Schritt fortzufahren. Die Konfiguration wird erst gespeichert, wenn Sie im letzten Schritt auf die Schaltfläche Fertig klicken.

  • Änderungen verwerfen: Klicken Sie nach dem Vornehmen von Änderungen, um die Konfiguration zu schließen, ohne die an einem Schritt vorgenommenen Änderungen zu speichern. Sie werden in einer Meldung aufgefordert, zu bestätigen, dass Sie die Änderungen verwerfen möchten.

Schritt 2: Wähle eine Tabelle

Wählen Sie in diesem Schritt eine Tabelle aus. Jedes Benutzeroberflächenelement dieses Schritts wird unten beschrieben.

Amazon Redshift Kopieraktivität - Konfigurationsschritt 2

  • Tabelle auswählen: In diesem Abschnitt werden Tabellen angezeigt, die im Amazon Redshift Endpoint verfügbar sind. Beim erneuten Öffnen einer vorhandenen Aktivitätskonfiguration wird nur die ausgewählte Tabelle angezeigt, anstatt die gesamte Tabellenliste neu zu laden.

    • Ausgewählter Schemaname: Der im vorherigen Schritt ausgewählte Schema wird hier aufgelistet.

    • Tabellennamen auswählen: Nachdem eine Tabelle ausgewählt wurde, wird sie hier aufgelistet.

    • Suchen: Geben Sie den Wert einer beliebigen Spalte in das Suchfeld ein, um die Liste der Tabellen zu filtern. Die Suche ist nicht groß- und kleinschreibungsabhängig. Wenn in der Tabelle bereits Tabellen angezeigt werden, werden die Tabellenergebnisse mit jedem Tastendruck in Echtzeit gefiltert. Um Tabellen während der Suche vom Endpoint neu zu laden, geben Sie Suchkriterien ein und aktualisieren Sie dann, wie unten beschrieben.

    • Aktualisieren: Klicken Sie auf das Aktualisierungssymbol oder das Wort Aktualisieren, um Tabellen vom Amazon Redshift Endpoint neu zu laden. Dies kann nützlich sein, wenn Tabellen zu Amazon Redshift hinzugefügt wurden. Diese Aktion aktualisiert alle Metadaten, die zum Erstellen der in der Konfiguration angezeigten Tabellentabelle verwendet werden.

    • Tabelle auswählen: Klicken Sie innerhalb der Tabelle irgendwo auf eine Zeile, um eine Tabelle auszuwählen. Es kann nur eine Tabelle ausgewählt werden. Die für jede Tabelle verfügbaren Informationen werden vom Amazon Redshift Endpoint abgerufen:

    Tipp

    Wenn die Tabelle nicht mit verfügbaren Tabellen gefüllt ist, wird die Amazon Redshift Verbindung ist möglicherweise nicht erfolgreich. Stellen Sie sicher, dass Sie verbunden sind, indem Sie die Verbindung erneut öffnen und die Anmeldeinformationen erneut testen.

  • Zurück: Klicken Sie hier, um die Konfiguration für diesen Schritt vorübergehend zu speichern und zum vorherigen Schritt zurückzukehren.

  • Weiter: Klicken Sie hier, um die Konfiguration für diesen Schritt vorübergehend zu speichern und mit dem nächsten Schritt fortzufahren. Die Konfiguration wird erst gespeichert, wenn Sie im letzten Schritt auf die Schaltfläche Fertig klicken.

  • Änderungen verwerfen: Klicken Sie nach dem Vornehmen von Änderungen hier, um die Konfiguration zu schließen, ohne die an einem Schritt vorgenommenen Änderungen zu speichern. In einer Meldung werden Sie aufgefordert zu bestätigen, dass Sie die Änderungen verwerfen möchten.

Schritt 3: Einstellungen festlegen

Geben Sie in diesem Schritt die Einstellungen für den gewünschten AWS-Bucket an. Jedes Benutzeroberflächenelement dieses Schritts wird unten beschrieben.

Amazon Redshift Kopieraktivität - Konfigurationsschritt 3

Tipp

Felder mit variablem Symbol Unterstützung der Verwendung von globalen Variablen, Projektvariablen und Jitterbit-Variablen. Beginnen Sie entweder mit einer öffnenden eckigen Klammer [ in das Feld oder durch Klicken auf das Variablensymbol, um eine Liste der vorhandenen Variablen anzuzeigen, aus denen Sie auswählen können.

  • Ansatz: Geben Sie den Anmeldeinformationsansatz an, der für den AWS-Bucket verwendet werden soll, entweder rollenbasiert oder schlüsselbasiert:.

    • Rollenbasiert: Bei Verwendung des rollenbasierten Ansatzes für den Zugriff auf den AWS-Bucket:

      • IAM-Rolle für Anmeldeinformationen: Geben Sie die mit den Anmeldeinformationen verknüpfte IAM- Rolle ein.
    • Schlüsselbasiert: Wenn Sie den schlüsselbasierten Ansatz für den Zugriff auf den AWS-Bucket verwenden:

      • AWS-Zugriffsschlüssel-ID: Geben Sie die AWS-Zugriffsschlüssel-ID ein.
      • Geheimer AWS-Zugriffsschlüssel: Geben Sie den geheimen AWS-Zugriffsschlüssel ein.
  • Von: Geben Sie den Amazon-Bucket ein, aus dem die Daten kopiert werden sollen.

  • Region: Geben Sie die Amazon-Region des Buckets ein, aus dem die Daten kopiert werden sollen.

  • Trennzeichen: Geben Sie das Trennzeichen ein, das beim Kopieren der Daten verwendet werden soll.

  • Zurück: Klicken Sie hier, um die Konfiguration für diesen Schritt vorübergehend zu speichern und zum vorherigen Schritt zurückzukehren.

  • Weiter: Klicken Sie hier, um die Konfiguration für diesen Schritt vorübergehend zu speichern und mit dem nächsten Schritt fortzufahren. Die Konfiguration wird erst gespeichert, wenn Sie im letzten Schritt auf die Schaltfläche Fertig klicken.

  • Änderungen verwerfen Klicken Sie nach dem Vornehmen von Änderungen hierauf, um die Konfiguration zu schließen, ohne die an einem Schritt vorgenommenen Änderungen zu speichern. Sie werden in einer Meldung aufgefordert, zu bestätigen, dass Sie die Änderungen verwerfen möchten.

Schritt 4: Überprüfen der Datenschemata

Alle vom Endpoint generierten Anforderungs- oder Antwortschemata werden angezeigt. Jedes Benutzeroberflächenelement dieses Schritts wird unten beschrieben.

Amazon Redshift Kopieraktivität - Konfigurationsschritt 4

  • Datenschemata: Diese Datenschemata werden von benachbarten Transformations übernommen und beim Transformation erneut angezeigt.

    Notiz

    Die in einer Transformation bereitgestellten Daten haben Vorrang vor der Aktivitätskonfiguration.

    Der Amazon Redshift Konnektor verwendet den Amazon Redshift JDBC-Treiber Version 2.1.0.28 und Amazon Redshift SQL-Befehle. Weitere Informationen finden Sie in der Amazon Redshift Dokumentation und die Amazon Redshift Systemübersicht Dokumentation für weitere Informationen.

    Die Anforderungs- und Antwortdatenschemata bestehen aus diesen Knoten und Feldern:

    • Anforderung

      Anforderungsschemafeld/-knoten Hinweise
      accounts Die ausgewählte Tabelle, in die die Datensätze kopiert werden sollen
      approach Der in Schritt 3: Einstellungen festlegen ausgewählte Ansatz
      delimiter Abgegrenzte Bezeichner beginnen und enden mit doppelten Anführungszeichen (")
      from Der Amazon Redshift Bucket, aus dem die Datensätze kopiert werden sollen
      awsSecretAccessKey Geheimer Zugriffsschlüssel vom angegebenen AWS-Konto
      awsAccessKeyId Zugriffsschlüssel-ID vom angegebenen AWS-Konto
      iamRole IAM- Rolle vom angegebenen AWS-Konto
      region Region für das angegebene AWS-Konto
    • Antwort

      Antwortschemafeld/-knoten Hinweise
      accounts Knoten, der die in Schritt 2: Tabelle auswählen ausgewählte Tabelle darstellt
      desc String, der die Anzahl der erfolgreich kopierten Zeilen enthält
      error String-Meldung, die etwaige aufgetretene Fehler beschreibt
      status Boolesch zeigt Erfolg oder Misserfolg an
  • Aktualisieren: Klicken Sie auf das Aktualisierungssymbol oder das Wort Aktualisieren, um Schemas vom Amazon Redshift Endpoint neu zu generieren. Diese Aktion generiert auch ein Schema an anderen Stellen im gesamten Projekt neu, an denen auf dasselbe Schema verwiesen wird, z. B. in einer angrenzenden Transformation.

  • Zurück: Klicken Sie hier, um die Konfiguration für diesen Schritt vorübergehend zu speichern und zum vorherigen Schritt zurückzukehren.

  • Fertig: Klicken Sie, um die Konfiguration für alle Schritte zu speichern und die Aktivitätskonfiguration zu schließen.

  • Änderungen verwerfen Klicken Sie nach dem Vornehmen von Änderungen hierauf, um die Konfiguration zu schließen, ohne die an einem Schritt vorgenommenen Änderungen zu speichern. Sie werden in einer Meldung aufgefordert, zu bestätigen, dass Sie die Änderungen verwerfen möchten.

Nächste Schritte

Nachdem Sie eine Amazon Redshift -Kopieraktivität konfiguriert haben, schließen Sie die Konfiguration des Operation ab, indem Sie andere Aktivitäten, Transformations oder Scripts als Operation hinzufügen und konfigurieren. Sie können auch die Operation konfigurieren, die die Möglichkeit umfassen, Vorgänge zu verketten, die sich im gleichen oder in unterschiedlichen Workflows befinden.

Auf Menüaktionen für eine Aktivität kann über den Projektbereich und die Design-Canvas zugegriffen werden. Weitere Informationen finden Sie unter Aktionsmenü in Connector-Grundlagen.

Amazon Redshift Kopier-Aktivitäten können mit diesen Operation als Ziel verwendet werden:

Um die Aktivität mit Skriptfunktionen zu verwenden, schreiben Sie die Daten an einen temporären Speicherort und verwenden Sie dann diesen temporären Speicherort in der Skriptfunktion.

Wenn Sie bereit sind, einsetzen und ausführen den Operation und validieren Sie das Verhalten durch Überprüfen der Operation.