Zum Inhalt springen

Amazon Redshift Update Bulk-Aktivität

Einführung

Eine Amazon Redshift Update Bulk-Aktivität, die ihre Amazon Redshift-Verbindung verwendet, aktualisiert mehrere Datensätze in einer Tabelle in Amazon Redshift und ist dafür gedacht, als Ziel zum Konsumieren von Daten in einem Vorgang verwendet zu werden. Diese Aktivität bietet die Option, die Anzahl der Datensätze pro Batch festzulegen und die Möglichkeit, die Verarbeitung der verbleibenden Datensätze zu stoppen, wenn ein Fehler gefunden wird.

Erstellen einer Amazon Redshift Update Bulk-Aktivität

Eine Instanz einer Amazon Redshift Update Bulk-Aktivität wird aus einer Amazon Redshift-Verbindung unter Verwendung des Aktivitätstyps Update Bulk erstellt.

Um eine Instanz einer Aktivität zu erstellen, ziehen Sie den Aktivitätstyp auf die Entwurfsfläche oder kopieren Sie den Aktivitätstyp und fügen Sie ihn auf der Entwurfsfläche ein. Weitere Informationen finden Sie unter Erstellen einer Aktivitäts- oder Toolinstanz in Komponentenwiederverwendung.

Eine vorhandene Amazon Redshift Update Bulk-Aktivität kann von diesen Orten aus bearbeitet werden:

Konfigurieren einer Amazon Redshift Update Bulk-Aktivität

Befolgen Sie diese Schritte, um eine Amazon Redshift Update Bulk-Aktivität zu konfigurieren:

Schritt 1: Geben Sie einen Namen ein und wählen Sie ein Schema

In diesem Schritt geben Sie einen Namen für die Aktivität ein und wählen ein Schema aus. Jedes Benutzeroberflächenelement dieses Schrittes wird im Folgenden beschrieben.

Amazon Redshift Update Bulk-Aktivitätskonfiguration Schritt 1

  • Name: Geben Sie einen Namen ein, um die Aktivität zu identifizieren. Der Name muss für jede Amazon Redshift Update Bulk-Aktivität einzigartig sein und darf keine Schrägstriche (/) oder Doppelpunkte (:) enthalten.

  • Wählen Sie ein Schema: In diesem Abschnitt werden die in dem Amazon Redshift-Endpunkt verfügbaren Schemata angezeigt. Beim erneuten Öffnen einer vorhandenen Aktivitätskonfiguration wird nur das ausgewählte Schema angezeigt, anstatt die gesamte Schema-Liste neu zu laden.

    • Ausgewählter Schema-Name: Nachdem ein Schema ausgewählt wurde, wird es hier aufgelistet.

    • Suche: Geben Sie den Wert einer beliebigen Spalte in das Suchfeld ein, um die Liste der Schemata zu filtern. Die Suche ist nicht groß-/kleinschreibungsempfindlich. Wenn Schemata bereits in der Tabelle angezeigt werden, werden die Tabellenergebnisse in Echtzeit mit jedem Tastendruck gefiltert. Um Schemata vom Endpunkt beim Suchen neu zu laden, geben Sie Suchkriterien ein und aktualisieren Sie dann, wie unten beschrieben.

    • Aktualisieren: Klicken Sie auf das Aktualisierungssymbol oder auf das Wort Aktualisieren, um Schemata vom Amazon Redshift-Endpunkt neu zu laden. Dies kann nützlich sein, wenn Schemata zu Amazon Redshift hinzugefügt wurden. Diese Aktion aktualisiert alle Metadaten, die zum Erstellen der in der Konfiguration angezeigten Schema-Tabelle verwendet werden.

    • Auswählen eines Schemas: Klicken Sie innerhalb der Tabelle auf eine beliebige Stelle in einer Zeile, um ein Schema auszuwählen. Es kann nur ein Schema ausgewählt werden. Die für jedes Schema verfügbaren Informationen werden vom Amazon Redshift-Endpunkt abgerufen:

    Tipp

    Wenn die Tabelle nicht mit verfügbaren Schemata gefüllt wird, könnte die Amazon Redshift-Verbindung nicht erfolgreich sein. Stellen Sie sicher, dass Sie verbunden sind, indem Sie die Verbindung erneut öffnen und die Anmeldeinformationen erneut testen.

  • Optionale Einstellungen: Klicken Sie, um zusätzliche optionale Einstellungen zu erweitern:

    • Batch-Größe: Geben Sie eine Batch-Größe ein, die größer als 0 oder kleiner als 10000 ist. Der Standardwert beträgt 100.
    • Bei Fehler fortfahren: Wählen Sie diese Option, um die Ausführung der Aktivität fortzusetzen, wenn ein Fehler für einen Datensatz in einer Batch-Anforderung auftritt. Wenn Fehler auftreten, werden diese im Betriebsprotokoll aufgezeichnet.
  • Speichern & Beenden: Wenn aktiviert, klicken Sie, um die Konfiguration für diesen Schritt zu speichern und die Aktivitätskonfiguration zu schließen.

  • Weiter: Klicken Sie, um die Konfiguration für diesen Schritt vorübergehend zu speichern und zum nächsten Schritt fortzufahren. Die Konfiguration wird nicht gespeichert, bis Sie die Schaltfläche Fertig im letzten Schritt klicken.

  • Änderungen verwerfen: Nachdem Sie Änderungen vorgenommen haben, klicken Sie, um die Konfiguration zu schließen, ohne die vorgenommenen Änderungen zu speichern. Eine Nachricht fordert Sie auf, zu bestätigen, dass Sie die Änderungen verwerfen möchten.

Schritt 2: Wählen Sie eine Tabelle

In diesem Schritt wählen Sie eine Tabelle aus. Jedes Benutzeroberflächenelement dieses Schrittes wird im Folgenden beschrieben.

Amazon Redshift Update Bulk-Aktivitätskonfiguration Schritt 2

  • Wählen Sie eine Tabelle: In diesem Abschnitt werden die in der Amazon Redshift-Endpunkt verfügbaren Tabellen angezeigt. Beim erneuten Öffnen einer vorhandenen Aktivitätskonfiguration wird nur die ausgewählte Tabelle angezeigt, anstatt die gesamte Tabellenliste neu zu laden.

    • Ausgewählter Schemabezeichner: Der im vorherigen Schritt ausgewählte Schemabezeichner wird hier aufgeführt.

    • Ausgewählter Tabellenname: Nachdem eine Tabelle ausgewählt wurde, wird sie hier aufgeführt.

    • Suche: Geben Sie den Wert einer beliebigen Spalte in das Suchfeld ein, um die Liste der Tabellen zu filtern. Die Suche ist nicht groß-/kleinschreibungsempfindlich. Wenn Tabellen bereits innerhalb der Tabelle angezeigt werden, werden die Tabellenergebnisse in Echtzeit mit jedem Tastendruck gefiltert. Um Tabellen vom Endpunkt beim Suchen neu zu laden, geben Sie Suchkriterien ein und aktualisieren Sie dann, wie unten beschrieben.

    • Aktualisieren: Klicken Sie auf das Aktualisierungssymbol oder das Wort Aktualisieren, um Tabellen vom Amazon Redshift-Endpunkt neu zu laden. Dies kann nützlich sein, wenn Tabellen zu Amazon Redshift hinzugefügt wurden. Diese Aktion aktualisiert alle Metadaten, die zum Erstellen der Tabelle der Tabellen verwendet werden, die in der Konfiguration angezeigt werden.

    • Tabelle auswählen: Klicken Sie innerhalb der Tabelle auf eine beliebige Stelle in einer Zeile, um eine Tabelle auszuwählen. Es kann nur eine Tabelle ausgewählt werden. Die Informationen, die für jede Tabelle verfügbar sind, werden vom Amazon Redshift-Endpunkt abgerufen:

    Tipp

    Wenn die Tabelle nicht mit verfügbaren Tabellen gefüllt wird, könnte die Amazon Redshift-Verbindung nicht erfolgreich sein. Stellen Sie sicher, dass Sie verbunden sind, indem Sie die Verbindung erneut öffnen und die Anmeldeinformationen erneut testen.

  • Zurück: Klicken Sie, um die Konfiguration für diesen Schritt vorübergehend zu speichern und zum vorherigen Schritt zurückzukehren.

  • Weiter: Klicken Sie, um die Konfiguration für diesen Schritt vorübergehend zu speichern und mit dem nächsten Schritt fortzufahren. Die Konfiguration wird nicht gespeichert, bis Sie auf die Schaltfläche Fertig im letzten Schritt klicken.

  • Änderungen verwerfen: Nachdem Sie Änderungen vorgenommen haben, klicken Sie, um die Konfiguration zu schließen, ohne die vorgenommenen Änderungen zu speichern. Eine Nachricht fordert Sie auf, zu bestätigen, dass Sie die Änderungen verwerfen möchten.

Schritt 3: Überprüfen der Datenschemas

Alle Anforderungs- oder Antwortschemas, die vom Endpunkt generiert wurden, werden angezeigt. Jedes Benutzeroberflächenelement dieses Schrittes wird im Folgenden beschrieben.

Amazon Redshift Update Bulk-Aktivitätskonfiguration Schritt 3

  • Daten-Schemas: Diese Daten-Schemas werden von benachbarten Transformationen übernommen und während der Transformationszuordnung erneut angezeigt.

    Hinweis

    Daten, die in einer Transformation bereitgestellt werden, haben Vorrang vor der Aktivitätskonfiguration.

    Der Amazon Redshift Connector verwendet den Amazon Redshift JDBC-Treiber in der Version 2.1.0.28 und Amazon Redshift SQL-Befehle. Weitere Informationen finden Sie in der Amazon Redshift-Dokumentation und der Dokumentation zum Amazon Redshift-Systemüberblick.

    Die Daten-Schemas für Anfragen und Antworten bestehen aus diesen Knoten und Feldern:

    • Anfrage

      Anfrage-Schema Feld/Knoten Hinweise
      accounts Knoten der Konten, die aktualisiert werden sollen
      Set Knoten der Informationen, die aktualisiert werden sollen
      id ID, die gesetzt werden soll
      name Name, der gesetzt werden soll
      balance Wert, der gesetzt werden soll
      Where Knoten der Kriterien, die verwendet werden, um Informationen zu identifizieren, die aktualisiert werden sollen
      columnName Name der Spalte
      condition Verwendet eine Amazon Redshift SQL-Bedingung
      value Wert für die Bedingung
    • Antwort

      Antwort-Schema Feld/Knoten Hinweise
      bulkErrorResponse Das Format des Anfrageschemas
      tableName Name der Tabelle, in der Datensätze massenhaft aktualisiert wurden
      responseDetails Knoten mit Details aus der Antwort
      batchSize Anzahl der Datensätze pro Batch
      totalRecords Gesamtanzahl der Datensätze, die an der Operation beteiligt waren
      recordsAffected Gesamtanzahl der Datensätze, die massenhaft aktualisiert wurden
      errorDetails Knoten, der alle Fehlermeldungen enthält
      SqlState Code, der SQL-Fehlerbedingungen identifiziert
      errorMsg Fehlermeldung
      errorCode Fehlercode
  • Aktualisieren: Klicken Sie auf das Aktualisierungssymbol oder das Wort Aktualisieren, um Schemas vom Amazon Redshift-Endpunkt neu zu generieren. Diese Aktion regeneriert auch ein Schema an anderen Stellen im Projekt, wo dasselbe Schema referenziert wird, wie in einer angrenzenden Transformation.

  • Zurück: Klicken Sie, um die Konfiguration für diesen Schritt vorübergehend zu speichern und zum vorherigen Schritt zurückzukehren.

  • Fertig: Klicken Sie, um die Konfiguration für alle Schritte zu speichern und die Aktivitätskonfiguration zu schließen.

  • Änderungen verwerfen: Nach Änderungen klicken Sie, um die Konfiguration zu schließen, ohne die vorgenommenen Änderungen an einem Schritt zu speichern. Eine Nachricht fragt Sie, ob Sie die Änderungen wirklich verwerfen möchten.

Nächste Schritte

Nachdem Sie eine Amazon Redshift Update Bulk-Aktivität konfiguriert haben, vervollständigen Sie die Konfiguration des Vorgangs, indem Sie weitere Aktivitäten oder Tools als Vorgangsschritte hinzufügen und konfigurieren. Sie können auch die Betriebseinstellungen konfigurieren, die die Möglichkeit umfassen, Vorgänge zusammenzuführen, die sich in denselben oder unterschiedlichen Workflows befinden.

Menüaktionen für eine Aktivität sind im Projektbereich und auf der Entwurfsgrafik zugänglich. Für Details siehe Aktivitätsaktionsmenü in Connector-Grundlagen.

Amazon Redshift Update Bulk-Aktivitäten können als Ziel mit diesen Vorgangsmustern verwendet werden:

Um die Aktivität mit Skriptfunktionen zu verwenden, schreiben Sie die Daten an einen temporären Speicherort und verwenden Sie dann diesen temporären Speicherort in der Skriptfunktion.

Wenn Sie bereit sind, setzen Sie den Vorgang ein und führen Sie ihn aus und validieren Sie das Verhalten, indem Sie die Vorgangsprotokolle überprüfen.