Zum Inhalt springen

Amazon Redshift Insert Bulk-Aktivität

Einführung

Eine Amazon Redshift Insert Bulk-Aktivität unter Verwendung ihrer Amazon Redshift Verbindung, fügt mehrere Datensätze in eine Tabelle bei Amazon Redshift ein und soll als Ziel zum Verbrauchen von Daten in einer Operation verwendet werden. Diese Aktivität bietet die Möglichkeit, die Anzahl der Datensätze pro Charge festzulegen und die Verarbeitung der verbleibenden Datensätze zu stoppen, wenn ein Fehler gefunden wird.

Erstellen einer Amazon Redshift Insert Bulk-Aktivität

Eine Instanz einer Amazon Redshift Insert Bulk-Aktivität wird aus einer Amazon Redshift Verbindung erstellt mithilfe des Aktivitätstyps Masseneinfügung.

Um eine Instanz einer Aktivität zu erstellen, ziehen Sie den Aktivitätstyp auf die Design-Canvas oder kopieren Sie den Aktivitätstyp und fügen Sie ihn auf der Design-Canvas ein. Weitere Informationen finden Sie unter Erstellen einer Aktivitätsinstanz in Komponentenwiederverwendung.

Eine vorhandene Amazon Redshift Insert Bulk-Aktivität kann von diesen Orten aus bearbeitet werden:

Konfigurieren einer Amazon Redshift Insert Bulk-Aktivität

Befolgen Sie diese Schritte, um eine Amazon Redshift Aktivität Insert Bulk zu konfigurieren:

Schritt 1: Geben Sie einen Namen ein und wählen Sie ein Schema aus

Geben Sie in diesem Schritt einen Namen für die Aktivität ein und wählen Sie ein Schema aus. Jedes Benutzeroberflächenelement dieses Schritts wird unten beschrieben.

Amazon Redshift Insert Bulk-Aktivitätskonfigurationsschritt 1

  • Name: Geben Sie einen Namen zur Identifizierung der Aktivität ein. Der Name muss für jede Amazon Redshift Insert Bulk-Aktivität eindeutig sein und darf keine Schrägstriche enthalten (/) oder Doppelpunkte (:).

  • Wählen Sie ein Schema aus: In diesem Abschnitt werden die im Amazon Redshift Endpoint verfügbaren Schemata angezeigt. Beim erneuten Öffnen einer vorhandenen Aktivitätskonfiguration wird nur das ausgewählte Schema angezeigt, anstatt die gesamte Schema neu zu laden.

    • Ausgewählter Schemaname: Nachdem ein Schema ausgewählt wurde, wird es hier aufgelistet.

    • Suchen: Geben Sie den Wert einer beliebigen Spalte in das Suchfeld ein, um die Liste der Schemata zu filtern. Bei der Suche wird nicht zwischen Groß- und Kleinschreibung unterschieden. Wenn in der Tabelle bereits Schemata angezeigt werden, werden die Tabellenergebnisse mit jedem Tastendruck in Echtzeit gefiltert. Um Schemata während der Suche vom Endpoint neu zu laden, geben Sie Suchkriterien ein und aktualisieren Sie dann, wie unten beschrieben.

    • Aktualisieren: Klicken Sie auf das Aktualisierungssymbol oder das Wort Aktualisieren, um Schemata vom Amazon Redshift Endpoint neu zu laden. Dies kann nützlich sein, wenn Schemata zu Amazon Redshift hinzugefügt wurden. Diese Aktion aktualisiert alle Metadaten, die zum Erstellen der in der Konfiguration angezeigten Schematabelle verwendet werden.

    • Auswählen eines Schemas: Klicken Sie in der Tabelle irgendwo auf eine Zeile, um ein Schema auszuwählen. Es kann nur ein Schema ausgewählt werden. Die für jedes Schema verfügbaren Informationen werden vom Amazon Redshift Endpoint abgerufen:

    Tipp

    Wenn die Tabelle nicht mit verfügbaren Schemas gefüllt ist, wird die Amazon Redshift Verbindung ist möglicherweise nicht erfolgreich. Stellen Sie sicher, dass Sie verbunden sind, indem Sie die Verbindung erneut öffnen und die Anmeldeinformationen erneut testen.

  • Optionale Einstellungen: Klicken Sie hier, um weitere optionale Einstellungen einzublenden:

    • Batchgröße: Geben Sie eine Charge ein, die größer als 0 oder kleiner als 10000 ist. Standardwert: 100.
    • Bei Fehler fortfahren: Wählen Sie diese Option aus, um die Aktivitätsausführung fortzusetzen, wenn bei einem Datensatz in einer Charge-Anforderung ein Fehler auftritt. Wenn Fehler auftreten, werden diese in das Operation geschrieben.
  • Speichern und beenden: Wenn aktiviert, klicken Sie hier, um die Konfiguration für diesen Schritt zu speichern und die Aktivitätskonfiguration zu schließen.

  • Weiter: Klicken Sie hier, um die Konfiguration für diesen Schritt vorübergehend zu speichern und mit dem nächsten Schritt fortzufahren. Die Konfiguration wird erst gespeichert, wenn Sie im letzten Schritt auf die Schaltfläche Fertig klicken.

  • Änderungen verwerfen: Klicken Sie nach dem Vornehmen von Änderungen hier, um die Konfiguration zu schließen, ohne die an einem Schritt vorgenommenen Änderungen zu speichern. Sie werden in einer Meldung aufgefordert, zu bestätigen, dass Sie die Änderungen verwerfen möchten.

Schritt 2: Wähle eine Tabelle

Wählen Sie in diesem Schritt eine Tabelle aus. Jedes Benutzeroberflächenelement dieses Schritts wird unten beschrieben.

Amazon Redshift Insert Bulk-Aktivitätskonfigurationsschritt 2

  • Tabelle auswählen: In diesem Abschnitt werden Tabellen angezeigt, die im Amazon Redshift Endpoint verfügbar sind. Beim erneuten Öffnen einer vorhandenen Aktivitätskonfiguration wird nur die ausgewählte Tabelle angezeigt, anstatt die gesamte Tabellenliste neu zu laden.

    • Ausgewählter Schemaname: Der im vorherigen Schritt ausgewählte Schema wird hier aufgelistet.

    • Tabellennamen auswählen: Nachdem eine Tabelle ausgewählt wurde, wird sie hier aufgelistet.

    • Suchen: Geben Sie den Wert einer beliebigen Spalte in das Suchfeld ein, um die Liste der Tabellen zu filtern. Die Suche ist nicht groß- und kleinschreibungsabhängig. Wenn in der Tabelle bereits Tabellen angezeigt werden, werden die Tabellenergebnisse mit jedem Tastendruck in Echtzeit gefiltert. Um Tabellen während der Suche vom Endpoint neu zu laden, geben Sie Suchkriterien ein und aktualisieren Sie dann, wie unten beschrieben.

    • Aktualisieren: Klicken Sie auf das Aktualisierungssymbol oder das Wort Aktualisieren, um Tabellen vom Amazon Redshift Endpoint neu zu laden. Dies kann nützlich sein, wenn Tabellen zu Amazon Redshift hinzugefügt wurden. Diese Aktion aktualisiert alle Metadaten, die zum Erstellen der in der Konfiguration angezeigten Tabellentabelle verwendet werden.

    • Tabelle auswählen: Klicken Sie innerhalb der Tabelle irgendwo auf eine Zeile, um eine Tabelle auszuwählen. Es kann nur eine Tabelle ausgewählt werden. Die für jede Tabelle verfügbaren Informationen werden vom Amazon Redshift Endpoint abgerufen:

    Tipp

    Wenn die Tabelle nicht mit verfügbaren Tabellen gefüllt ist, wird die Amazon Redshift Verbindung ist möglicherweise nicht erfolgreich. Stellen Sie sicher, dass Sie verbunden sind, indem Sie die Verbindung erneut öffnen und die Anmeldeinformationen erneut testen.

  • Zurück: Klicken Sie hier, um die Konfiguration für diesen Schritt vorübergehend zu speichern und zum vorherigen Schritt zurückzukehren.

  • Weiter: Klicken Sie hier, um die Konfiguration für diesen Schritt vorübergehend zu speichern und mit dem nächsten Schritt fortzufahren. Die Konfiguration wird erst gespeichert, wenn Sie im letzten Schritt auf die Schaltfläche Fertig klicken.

  • Änderungen verwerfen: Klicken Sie nach dem Vornehmen von Änderungen hier, um die Konfiguration zu schließen, ohne die an einem Schritt vorgenommenen Änderungen zu speichern. In einer Meldung werden Sie aufgefordert zu bestätigen, dass Sie die Änderungen verwerfen möchten.

Schritt 3: Überprüfen der Datenschemata

Alle vom Endpoint generierten Anforderungs- oder Antwortschemata werden angezeigt. Jedes Benutzeroberflächenelement dieses Schritts wird unten beschrieben.

Amazon Redshift Insert Bulk-Aktivitätskonfigurationsschritt 3

  • Datenschemata: Diese Datenschemata werden von benachbarten Transformations übernommen und beim Transformation erneut angezeigt.

    Notiz

    Die in einer Transformation bereitgestellten Daten haben Vorrang vor der Aktivitätskonfiguration.

    Der Amazon Redshift Konnektor verwendet den Amazon Redshift JDBC-Treiber Version 2.1.0.28 und Amazon Redshift SQL-Befehle. Weitere Informationen finden Sie in der Amazon Redshift Dokumentation und die Amazon Redshift Systemübersicht Dokumentation für weitere Informationen.

    Die Anforderungs- und Antwortdatenschemata bestehen aus diesen Knoten und Feldern:

    • Anforderung

      Anforderungsschemafeld/-knoten Hinweise
      accounts Knoten, der die Konten darstellt, in die Datensätze massenweise eingefügt werden sollen
      id Einzufügende ID
      name Einzufügender Name
      balance Einzufügender Wert
    • Antwort

      Antwortschemafeld/-knoten Hinweise
      bulkErrorResponse Das Format des Schema
      tableName Name der Tabelle, in die Datensätze massenhaft eingefügt wurden
      responseDetails Knoten mit Details aus der Antwort
      batchSize Anzahl der Datensätze, die pro Charge massenweise eingefügt wurden
      totalRecords Gesamtzahl der verarbeiteten Datensätze
      recordsAffected Gesamtzahl der Datensätze, die massenhaft eingefügt wurden
      errorDetails Knoten, der alle Fehlermeldungen enthält
      SqlState Code zur Erkennung von SQL-Fehlerzuständen
      errorMsg Fehlermeldung
      errorCode Fehlercode
  • Aktualisieren: Klicken Sie auf das Aktualisierungssymbol oder das Wort Aktualisieren, um Schemas vom Amazon Redshift Endpoint neu zu generieren. Diese Aktion generiert auch ein Schema an anderen Stellen im gesamten Projekt neu, an denen auf dasselbe Schema verwiesen wird, z. B. in einer angrenzenden Transformation.

  • Zurück: Klicken Sie hier, um die Konfiguration für diesen Schritt vorübergehend zu speichern und zum vorherigen Schritt zurückzukehren.

  • Fertig: Klicken Sie, um die Konfiguration für alle Schritte zu speichern und die Aktivitätskonfiguration zu schließen.

  • Änderungen verwerfen Klicken Sie nach dem Vornehmen von Änderungen hierauf, um die Konfiguration zu schließen, ohne die an einem Schritt vorgenommenen Änderungen zu speichern. Sie werden in einer Meldung aufgefordert, zu bestätigen, dass Sie die Änderungen verwerfen möchten.

Nächste Schritte

Nachdem Sie eine Amazon Redshift Aktivität Insert Bulk konfiguriert haben, schließen Sie die Konfiguration des Operation ab, indem Sie andere Aktivitäten, Transformations oder Scripts als Operation hinzufügen und konfigurieren. Sie können auch die Operation konfigurieren, die die Möglichkeit umfassen, Vorgänge zu verketten, die sich im gleichen oder in unterschiedlichen Workflows befinden.

Auf Menüaktionen für eine Aktivität kann über den Projektbereich und die Design-Canvas zugegriffen werden. Weitere Informationen finden Sie unter Aktionsmenü in Connector-Grundlagen.

Amazon Redshift Insert Bulk-Aktivitäten können als Ziel mit diesen Operation verwendet werden:

Um die Aktivität mit Skriptfunktionen zu verwenden, schreiben Sie die Daten an einen temporären Speicherort und verwenden Sie dann diesen temporären Speicherort in der Skriptfunktion.

Wenn Sie bereit sind, einsetzen und ausführen den Operation und validieren Sie das Verhalten durch Überprüfen der Operation.