Amazon Redshift Abfrageaktivität
Einführung
Eine Amazon Redshift Abfrage-Aktivität, die ihre Amazon Redshift-Verbindung verwendet, ruft Datensätze aus einer Tabelle in Amazon Redshift ab und ist als Quelle gedacht, um Daten in einem Vorgang bereitzustellen.
Erstellen einer Amazon Redshift Abfrageaktivität
Eine Instanz einer Amazon Redshift Abfrage-Aktivität wird aus einer Amazon Redshift-Verbindung unter Verwendung des Abfrage-Aktivitätstyps erstellt.
Um eine Instanz einer Aktivität zu erstellen, ziehen Sie den Aktivitätstyp auf die Entwurfsfläche oder kopieren Sie den Aktivitätstyp und fügen Sie ihn auf der Entwurfsfläche ein. Für Details siehe Erstellen einer Aktivitäts- oder Toolinstanz in Komponentenwiederverwendung.
Eine vorhandene Amazon Redshift Abfrage-Aktivität kann von diesen Orten aus bearbeitet werden:
- Die Entwurfsfläche (siehe Komponentenaktionsmenü in Entwurfsfläche).
- Der Komponenten-Tab im Projektbereich (siehe Komponentenaktionsmenü in Projektbereich Komponenten-Tab).
Konfigurieren einer Amazon Redshift Abfrageaktivität
Befolgen Sie diese Schritte, um eine Amazon Redshift Abfrage-Aktivität zu konfigurieren:
-
Schritt 1: Geben Sie einen Namen ein und wählen Sie ein Schema aus
Geben Sie einen Namen für die Aktivität ein und wählen Sie ein Schema aus. -
Schritt 2: Wählen Sie ein Objekt aus
Wählen Sie ein Objekt aus, das abgefragt werden soll. -
Schritt 3: Erstellen Sie Ihre Abfrage
Setzen Sie Bedingungen für eine Abfrage mithilfe der Objektfelder und wenden Sie Paging auf eine Abfrage an. -
Schritt 4: Überprüfen Sie die Datenschemas
Alle Anforderungs- oder Antwortschemas, die von dem Endpunkt generiert wurden, werden angezeigt.
Schritt 1: Geben Sie einen Namen ein und wählen Sie ein Schema
In diesem Schritt geben Sie einen Namen für die Aktivität ein und wählen ein Schema aus. Jedes Benutzeroberflächenelement dieses Schrittes wird im Folgenden beschrieben.
-
Name: Geben Sie einen Namen ein, um die Aktivität zu identifizieren. Der Name muss für jede Amazon Redshift Abfrage-Aktivität einzigartig sein und darf keine Schrägstriche (
/
) oder Doppelpunkte (:
) enthalten. -
Wählen Sie ein Schema: In diesem Abschnitt werden die in der Amazon Redshift-Endpunkt verfügbaren Schemata angezeigt. Beim erneuten Öffnen einer vorhandenen Aktivitätskonfiguration wird nur das ausgewählte Schema angezeigt, anstatt die gesamte Schema-Liste neu zu laden.
-
Ausgewählter Schema-Name: Nachdem ein Schema ausgewählt wurde, wird es hier aufgelistet.
-
Suche: Geben Sie den Wert einer Spalte in das Suchfeld ein, um die Liste der Schemata zu filtern. Die Suche ist nicht groß-/kleinschreibungsempfindlich. Wenn Schemata bereits in der Tabelle angezeigt werden, werden die Tabellenergebnisse in Echtzeit mit jedem Tastendruck gefiltert. Um Schemata vom Endpunkt beim Suchen neu zu laden, geben Sie Suchkriterien ein und aktualisieren Sie dann, wie unten beschrieben.
-
Aktualisieren: Klicken Sie auf das Aktualisierungssymbol oder das Wort Aktualisieren, um Schemata vom Amazon Redshift-Endpunkt neu zu laden. Dies kann nützlich sein, wenn Schemata zu Amazon Redshift hinzugefügt wurden. Diese Aktion aktualisiert alle Metadaten, die zum Erstellen der in der Konfiguration angezeigten Schema-Tabelle verwendet werden.
-
Auswählen eines Schemas: Klicken Sie innerhalb der Tabelle auf eine beliebige Stelle in einer Zeile, um ein Schema auszuwählen. Es kann nur ein Schema ausgewählt werden. Die Informationen, die für jedes Schema verfügbar sind, werden vom Amazon Redshift-Endpunkt abgerufen:
- Schema: Der Name des Amazon Redshift-Schemas.
Tipp
Wenn die Tabelle nicht mit verfügbaren Schemata gefüllt wird, könnte die Amazon Redshift-Verbindung nicht erfolgreich sein. Stellen Sie sicher, dass Sie verbunden sind, indem Sie die Verbindung erneut öffnen und die Anmeldeinformationen erneut testen.
-
-
Speichern & Beenden: Wenn aktiviert, klicken Sie, um die Konfiguration für diesen Schritt zu speichern und die Aktivitätskonfiguration zu schließen.
-
Weiter: Klicken Sie, um die Konfiguration für diesen Schritt vorübergehend zu speichern und zum nächsten Schritt fortzufahren. Die Konfiguration wird nicht gespeichert, bis Sie die Schaltfläche Fertig im letzten Schritt klicken.
-
Änderungen verwerfen: Nach Änderungen klicken Sie, um die Konfiguration zu schließen, ohne die vorgenommenen Änderungen an einem Schritt zu speichern. Eine Nachricht fordert Sie auf, zu bestätigen, dass Sie die Änderungen verwerfen möchten.
Schritt 2: Wählen Sie ein Objekt
In diesem Schritt wählen Sie ein Objekt aus. Jedes Benutzeroberflächenelement dieses Schrittes wird im Folgenden beschrieben.
-
Wählen Sie ein Objekt aus: In diesem Abschnitt werden die in der Amazon Redshift-Endpunkt verfügbaren Objekte angezeigt. Beim erneuten Öffnen einer vorhandenen Aktivitätskonfiguration wird nur das ausgewählte Objekt angezeigt, anstatt die gesamte Objektliste neu zu laden.
-
Ausgewählter Schema-Name: Der im vorherigen Schritt ausgewählte Schema-Name wird hier aufgeführt.
-
Wählen Sie einen Objektnamen aus: Nachdem ein Objekt ausgewählt wurde, wird es hier aufgeführt.
-
Suche: Geben Sie den Wert einer Spalte in das Suchfeld ein, um die Liste der Objekte zu filtern. Die Suche ist nicht groß-/kleinschreibungsempfindlich. Wenn Objekte bereits in der Tabelle angezeigt werden, werden die Tabellenergebnisse in Echtzeit mit jedem Tastendruck gefiltert. Um Objekte vom Endpunkt beim Suchen neu zu laden, geben Sie Suchkriterien ein und aktualisieren Sie dann, wie unten beschrieben.
-
Aktualisieren: Klicken Sie auf das Aktualisierungssymbol oder das Wort Aktualisieren, um Objekte vom Amazon Redshift-Endpunkt neu zu laden. Dies kann nützlich sein, wenn Objekte zu Amazon Redshift hinzugefügt wurden. Diese Aktion aktualisiert alle Metadaten, die zum Erstellen der in der Konfiguration angezeigten Objekttabelle verwendet werden.
-
Ein Objekt auswählen: Klicken Sie innerhalb der Tabelle auf eine beliebige Stelle in einer Zeile, um ein Objekt auszuwählen. Es kann nur ein Objekt ausgewählt werden. Die für jedes Objekt verfügbaren Informationen werden vom Amazon Redshift-Endpunkt abgerufen:
-
Objektname: Der Objektname von Amazon Redshift.
-
Typ: Der Objekttyp von Amazon Redshift.
-
Katalog: Der Objektkatalog von Amazon Redshift.
-
Hinweis
Wenn die Tabelle nicht mit verfügbaren Objekten gefüllt wird, könnte die Amazon Redshift-Verbindung nicht erfolgreich sein. Stellen Sie sicher, dass Sie verbunden sind, indem Sie die Verbindung erneut öffnen und die Anmeldeinformationen erneut testen.
-
-
Zurück: Klicken Sie, um die Konfiguration für diesen Schritt vorübergehend zu speichern und zum vorherigen Schritt zurückzukehren.
-
Weiter: Klicken Sie, um die Konfiguration für diesen Schritt vorübergehend zu speichern und mit dem nächsten Schritt fortzufahren. Die Konfiguration wird nicht gespeichert, bis Sie die Schaltfläche Fertig im letzten Schritt klicken.
-
Änderungen verwerfen: Nachdem Sie Änderungen vorgenommen haben, klicken Sie, um die Konfiguration zu schließen, ohne die Änderungen an einem Schritt zu speichern. Eine Nachricht fordert Sie auf, zu bestätigen, dass Sie die Änderungen verwerfen möchten.
Schritt 3: Erstellen Sie Ihre Abfrage
In diesem Schritt legen Sie Bedingungen für eine Abfrage mithilfe der Objektfelder fest und wenden Paging auf eine Abfrage an. Jedes Benutzeroberflächenelement dieses Schrittes wird im Folgenden beschrieben.
Hinweis
Felder mit einem Variablen-Icon unterstützen die Verwendung von globalen Variablen, Projektvariablen und Jitterbit-Variablen. Beginnen Sie entweder, indem Sie eine öffnende eckige Klammer [
in das Feld eingeben oder indem Sie auf das Variablen-Icon klicken, um eine Liste der vorhandenen Variablen anzuzeigen, aus der Sie auswählen können.
-
Suche: Geben Sie einen Teil eines Feldnamens in das Suchfeld ein, um die Liste der Felder für das ausgewählte Objekt zu filtern. Die Suche ist nicht groß-/kleinschreibungsempfindlich. Die aufgelisteten Ergebnisse werden in Echtzeit mit jedem Tastendruck gefiltert.
-
Aktualisieren: Klicken Sie auf das Aktualisierungs-Icon oder das Wort Aktualisieren, um die Felder des Objekts vom Amazon Redshift-Endpunkt neu zu laden.
-
Alle auswählen: Wenn Sie das Suchfeld verwenden, um zu filtern, können Sie dieses Kontrollkästchen verwenden, um alle sichtbaren Felder auf einmal auszuwählen.
-
Felder auswählen: Wählen Sie die Kontrollkästchen der Felder aus, die Sie in die Abfrage einbeziehen möchten, damit sie automatisch in die SELECT-Anweisung im Abfrage-String aufgenommen werden. Sie können auch Alle auswählen und alle Felder auf einmal mit dem Kontrollkästchen auswählen.
-
Seitenumbruch: Um eine Seitenumbruchklausel (eine Begrenzung der Anzahl der Datensätze mit einem optionalen Datensatzoffset) hinzuzufügen, können Sie das Dropdown-Menü verwenden, um die Seitenbegrenzung festzulegen und das Feld für die Eingabe eines Offsets zu verwenden. Wenn kein Offset angegeben ist, wird standardmäßig 0 verwendet. Eine einzelne Seitenumbruchklausel wird unterstützt. Wenn keine Seitenumbruchklausel enthalten ist, werden alle Datensätze zurückgegeben.
-
Anwenden: Klicken Sie, um die Klausel automatisch basierend auf den Dropdown-Auswahlen und dem eingegebenen Wert zu erstellen. Die automatisch erstellte Seitenumbruchklausel erscheint im Textfeld Abfrage-String.
-
Entfernen: Klicken Sie, um eine angewendete Seitenumbruchklausel zu entfernen.
-
-
Bedingungen: Um bedingte Klauseln hinzuzufügen, verwenden Sie die Felder unten als Eingabe, um die Klauseln zu erstellen, die dann im Textfeld Abfrage-String erscheinen.
-
Objekt: Feld: Verwenden Sie das Dropdown-Menü, um ein Feld aus dem ausgewählten Objekt auszuwählen.
-
Operator: Verwenden Sie das Dropdown-Menü, um einen Operator auszuwählen, der für den Datentyp des Feldes geeignet ist:
Operator Bezeichnung Beschreibung = Gleich != Ungleich LIKE 'string' Wie Wie string LIKE 'string%' Beginnt mit Beginnt mit string LIKE '%string' Endet mit Endet mit string LIKE '%string%' Enthält Enthält string < Kleiner als <= Kleiner oder gleich > Größer als >= Größer oder gleich -
Wert: Geben Sie den gewünschten Wert ein, der mit den Dropdown-Auswahlen verwendet werden soll.
-
Hinzufügen: Klicken Sie, um die Klausel automatisch basierend auf den Dropdown-Auswahlen und dem eingegebenen Wert zu erstellen. Die bedingte Klausel wird in das Textfeld Abfragezeichenfolge eingefügt.
-
Alle Entfernen: Klicken Sie, um alle eingegebenen bedingten Klauseln zu entfernen.
-
-
Abfragezeichenfolge: Während Sie Felder auswählen, Bedingungen festlegen und die Seitenanzahl einstellen, wird die Abfrageanweisung in diesem Textfeld automatisch mit den ausgewählten Feldern, Bedingungen und Seitenlimits ausgefüllt.
-
Abfrage testen: Klicken Sie, um die Abfrage zu validieren. Wenn die Abfrage gültig ist, werden maximal 50 Datensätze, die aus der Abfrage abgerufen wurden, in einer Tabelle angezeigt. Wenn die Abfrage ungültig ist, werden relevante Fehlermeldungen angezeigt.
Hinweis
Während der Laufzeit der Operation wird das Limit von 50 Datensätzen nicht durchgesetzt, es sei denn, es wird im Feld Seitenanzahl (früher beschrieben) angegeben.
-
Zurück: Klicken Sie, um die Konfiguration für diesen Schritt vorübergehend zu speichern und zum vorherigen Schritt zurückzukehren.
-
Weiter: Klicken Sie, um die Konfiguration für diesen Schritt vorübergehend zu speichern und mit dem nächsten Schritt fortzufahren. Die Konfiguration wird nicht gespeichert, bis Sie auf die Schaltfläche Fertig im letzten Schritt klicken.
-
Änderungen verwerfen: Nachdem Sie Änderungen vorgenommen haben, klicken Sie, um die Konfiguration zu schließen, ohne die vorgenommenen Änderungen zu speichern. Eine Nachricht fragt Sie, ob Sie die Änderungen wirklich verwerfen möchten.
Schritt 4: Überprüfen der Datenschemas
Alle von der Schnittstelle generierten Anforderungs- oder Antwortschemas werden angezeigt. Jedes Benutzeroberflächenelement dieses Schrittes wird im Folgenden beschrieben.
-
Datenschemas: Diese Datenschemas werden von benachbarten Transformationen geerbt und während der Transformationszuordnung erneut angezeigt.
Hinweis
Die in einer Transformation bereitgestellten Daten haben Vorrang vor der Aktivitätskonfiguration.
Der Amazon Redshift-Connector verwendet den Amazon Redshift JDBC-Treiber in der Version 2.1.0.28 und Amazon Redshift SQL-Befehle. Weitere Informationen finden Sie in der Amazon Redshift-Dokumentation und in der Dokumentation zur Amazon Redshift-Systemübersicht.
Das Antwortdatenschema hängt von der angegebenen Abfrage ab. In diesem Beispiel besteht es aus diesen Knoten und Feldern:
-
Antwort
Antwort-Schema-Feld/Knoten Hinweise accounts
Knoten der abgefragten Konten balance
Wert des abgefragten Kontos id
ID des abgefragten Kontos name
Name des abgefragten Kontos
-
-
Aktualisieren: Klicken Sie auf das Aktualisierungssymbol oder das Wort Aktualisieren, um die Schemata vom Amazon Redshift-Endpunkt neu zu generieren. Diese Aktion regeneriert auch ein Schema an anderen Stellen im Projekt, an denen dasselbe Schema referenziert wird, z. B. in einer angrenzenden Transformation.
-
Zurück: Klicken Sie, um die Konfiguration für diesen Schritt vorübergehend zu speichern und zum vorherigen Schritt zurückzukehren.
-
Fertig: Klicken Sie, um die Konfiguration für alle Schritte zu speichern und die Aktivitätskonfiguration zu schließen.
-
Änderungen verwerfen: Nachdem Sie Änderungen vorgenommen haben, klicken Sie, um die Konfiguration zu schließen, ohne die Änderungen an einem Schritt zu speichern. Eine Nachricht fordert Sie auf, zu bestätigen, dass Sie die Änderungen verwerfen möchten.
Nächste Schritte
Nachdem Sie eine Amazon Redshift Abfrage-Aktivität konfiguriert haben, vervollständigen Sie die Konfiguration der Operation, indem Sie andere Aktivitäten oder Werkzeuge als Operation Schritte hinzufügen und konfigurieren. Sie können auch die Betriebseinstellungen konfigurieren, die die Möglichkeit umfassen, Operationen zusammenzuschalten, die sich in denselben oder unterschiedlichen Workflows befinden.
Menüaktionen für eine Aktivität sind im Projektbereich und auf der Entwurfskanvas zugänglich. Für Details siehe Aktionsmenü der Aktivität in Connector-Grundlagen.
Amazon Redshift Abfrage-Aktivitäten können als Quelle mit diesen Betriebsmustern verwendet werden:
- Transformationsmuster
- Zwei-Ziel-Archivmuster (nur als erste Quelle)
- Zwei-Ziel-HTTP-Archivmuster (nur als erste Quelle)
- Zwei-Transformationsmuster (nur als erste Quelle)
Um die Aktivität mit Skriptfunktionen zu verwenden, schreiben Sie die Daten an einen temporären Speicherort und verwenden Sie dann diesen temporären Speicherort in der Skriptfunktion.
Wenn Sie bereit sind, bereitstellen und ausführen Sie den Vorgang und validieren Sie das Verhalten, indem Sie die Betriebsprotokolle überprüfen.