Google BigQuery Datenübertragungsaktivität

Einführung

Eine Google BigQuery Datenübertragungs-Aktivität, die ihre Google BigQuery-Verbindung verwendet, überträgt Daten von einer Datenquelle in ein Dataset in Google BigQuery und ist dazu gedacht, als Ziel für den Verbrauch von Daten in einem Vorgang verwendet zu werden.

Erstellen einer Google BigQuery Datenübertragungsaktivität

Eine Instanz einer Google BigQuery Datenübertragungs-Aktivität wird aus einer Google BigQuery-Verbindung unter Verwendung des Aktivitätstyps Datenübertragung erstellt.

Um eine Instanz einer Aktivität zu erstellen, ziehen Sie den Aktivitätstyp auf die Entwurfsfläche oder kopieren Sie den Aktivitätstyp und fügen Sie ihn auf der Entwurfsfläche ein. Für Details siehe Erstellen einer Aktivitäts- oder Toolinstanz in Komponentenwiederverwendung.

Eine vorhandene Google BigQuery Datenübertragungs-Aktivität kann von diesen Orten aus bearbeitet werden:

Die Entwurfsfläche (siehe Komponentenaktionsmenü in Entwurfsfläche).
Der Komponenten-Tab im Projektbereich (siehe Komponentenaktionsmenü in Projektbereich Komponenten-Tab).

Konfigurieren einer Google BigQuery Datenübertragungsaktivität

Befolgen Sie diese Schritte, um eine Google BigQuery Datenübertragungs-Aktivität zu konfigurieren:

Schritt 1: Geben Sie einen Namen ein und wählen Sie die Datenquelle aus
Geben Sie einen Namen für die Aktivität ein und wählen Sie die Datenquelle aus.
Schritt 2: Wählen Sie das Dataset aus
Wählen Sie das Dataset aus.
Schritt 3: Wählen Sie die Tabelle aus
Wählen Sie die Tabelle aus.
Schritt 4: Überprüfen Sie die Datenschemas
Alle Anfrage- oder Antwortschemas werden angezeigt.

Schritt 1: Geben Sie einen Namen ein und wählen Sie die Datenquelle aus

In diesem Schritt geben Sie einen Namen für die Aktivität ein und wählen die Datenquelle aus. Jedes Benutzeroberflächenelement dieses Schrittes wird im Folgenden beschrieben.

Google BigQuery Datenübertragungsaktivitätskonfiguration Schritt 1

Name: Geben Sie einen Namen ein, um die Aktivität zu identifizieren. Der Name muss für jede Google BigQuery Datenübertragungs-Aktivität einzigartig sein und darf keine Schrägstriche / oder Doppelpunkte : enthalten.
Wählen Sie die Datenquelle aus: In diesem Abschnitt werden die in der Google BigQuery-Endpunkt verfügbaren Datenquellen angezeigt, entweder Amazon S3 oder Google Cloud Storage.
- Ausgewählte Datenquelle: Nachdem eine Datenquelle ausgewählt wurde, wird sie hier aufgelistet.
- Suche: Geben Sie den Wert einer beliebigen Spalte in das Suchfeld ein, um die Liste der Datenquellen zu filtern. Die Suche ist nicht groß-/kleinschreibungsempfindlich. Wenn Datenquellen bereits in der Tabelle angezeigt werden, werden die Tabellenergebnisse in Echtzeit mit jedem Tastendruck gefiltert. Um Datenquellen vom Endpunkt beim Suchen neu zu laden, geben Sie Suchkriterien ein und aktualisieren Sie dann, wie unten beschrieben.
- Aktualisieren: Klicken Sie auf das Aktualisierungssymbol oder das Wort Aktualisieren, um die Datenquellen vom Google BigQuery-Endpunkt neu zu laden. Dies kann nützlich sein, wenn Datenquellen zu Google BigQuery hinzugefügt wurden. Diese Aktion aktualisiert alle Metadaten, die zum Erstellen der Tabelle der in der Konfiguration angezeigten Datenquellen verwendet werden.
- Auswählen einer Datenquelle: Klicken Sie innerhalb der Tabelle auf eine beliebige Stelle in einer Zeile, um eine Datenquelle auszuwählen. Es kann nur eine Datenquelle ausgewählt werden. Die für jede Datenquelle verfügbaren Informationen werden vom Google BigQuery-Endpunkt abgerufen:
  - Name: Der Name der Datenquelle.
  - Beschreibung: Die Beschreibung der Datenquelle.
Tipp

Wenn die Tabelle nicht mit verfügbaren Datenquellen gefüllt wird, könnte die Google BigQuery-Verbindung nicht erfolgreich sein. Stellen Sie sicher, dass Sie verbunden sind, indem Sie die Verbindung erneut öffnen und die Anmeldeinformationen erneut testen.
Speichern & Beenden: Wenn aktiviert, klicken Sie, um die Konfiguration für diesen Schritt zu speichern und die Aktivitätskonfiguration zu schließen.
Weiter: Klicken Sie, um die Konfiguration für diesen Schritt vorübergehend zu speichern und zum nächsten Schritt fortzufahren. Die Konfiguration wird nicht gespeichert, bis Sie die Schaltfläche Fertig im letzten Schritt klicken.
Änderungen verwerfen: Nach Änderungen klicken Sie, um die Konfiguration zu schließen, ohne die vorgenommenen Änderungen an einem Schritt zu speichern. Eine Nachricht fragt Sie, ob Sie die Änderungen wirklich verwerfen möchten.

Schritt 2: Wählen Sie den Datensatz

In diesem Schritt wählen Sie den Datensatz aus. Jedes Benutzeroberflächenelement dieses Schrittes wird unten beschrieben.

Google BigQuery Data Transfer activity configuration step 2

Wählen Sie den Datensatz: Dieser Abschnitt zeigt die in der Google BigQuery-Endpunkt verfügbaren Datensätze an.
- Ausgewählte Datenquelle: Die im vorherigen Schritt ausgewählte Datenquelle wird hier aufgelistet.
- Ausgewählter Datensatz: Nachdem ein Datensatz ausgewählt wurde, wird er hier aufgelistet.
- Suche: Geben Sie den Wert einer beliebigen Spalte in das Suchfeld ein, um die Liste der Datensätze zu filtern. Die Suche ist nicht groß-/kleinschreibungsempfindlich. Wenn Datensätze bereits in der Tabelle angezeigt werden, werden die Tabellenergebnisse in Echtzeit mit jedem Tastendruck gefiltert. Um Datensätze vom Endpunkt beim Suchen neu zu laden, geben Sie Suchkriterien ein und aktualisieren Sie dann, wie unten beschrieben.
- Aktualisieren: Klicken Sie auf das Aktualisierungssymbol oder das Wort Aktualisieren, um Datensätze vom Google BigQuery-Endpunkt neu zu laden. Dies kann nützlich sein, wenn Datensätze zu Google BigQuery hinzugefügt wurden. Diese Aktion aktualisiert alle Metadaten, die zum Erstellen der in der Konfiguration angezeigten Tabelle der Datensätze verwendet werden.
- Einen Datensatz auswählen: Klicken Sie innerhalb der Tabelle auf eine beliebige Stelle in einer Zeile, um einen Datensatz auszuwählen. Es kann nur ein Datensatz ausgewählt werden. Die für jeden Datensatz verfügbaren Informationen werden vom Google BigQuery-Endpunkt abgerufen:
  - Name: Der Name des Datensatzes.
  - Beschreibung: Die Beschreibung des Datensatzes.
Tipp

Wenn die Tabelle nicht mit verfügbaren Datensätzen gefüllt wird, könnte die Google BigQuery-Verbindung nicht erfolgreich sein. Stellen Sie sicher, dass Sie verbunden sind, indem Sie die Verbindung erneut öffnen und die Anmeldeinformationen erneut testen.
Zurück: Klicken Sie, um die Konfiguration für diesen Schritt vorübergehend zu speichern und zum vorherigen Schritt zurückzukehren.
Weiter: Klicken Sie, um die Konfiguration für diesen Schritt vorübergehend zu speichern und mit dem nächsten Schritt fortzufahren. Die Konfiguration wird nicht gespeichert, bis Sie auf die Schaltfläche Fertig im letzten Schritt klicken.
Änderungen verwerfen: Nach Änderungen klicken Sie, um die Konfiguration zu schließen, ohne die vorgenommenen Änderungen zu speichern. Eine Nachricht fragt Sie, ob Sie die Änderungen wirklich verwerfen möchten.

Schritt 3: Wählen Sie die Tabelle

In diesem Schritt wählen Sie die Tabelle aus. Jedes Benutzeroberflächenelement dieses Schrittes wird im Folgenden beschrieben.

Google BigQuery Data Transfer-Aktivitätskonfiguration Schritt 3

Tipp

Felder mit einem Variablen-Icon unterstützen die Verwendung von globalen Variablen, Projektvariablen und Jitterbit-Variablen. Beginnen Sie entweder, indem Sie eine öffnende eckige Klammer [ in das Feld eingeben oder indem Sie auf das Variablen-Icon klicken, um eine Liste der vorhandenen Variablen anzuzeigen.

Tabelle auswählen: In diesem Abschnitt werden die in der Google BigQuery-Endpunkt verfügbaren Tabellen angezeigt.
- Ausgewählter Datensatz: Der im vorherigen Schritt ausgewählte Datensatz wird hier aufgeführt.
- Ausgewählte Tabelle: Nachdem eine Tabelle ausgewählt wurde, wird sie hier aufgeführt.
- Suche: Geben Sie den Wert einer beliebigen Spalte in das Suchfeld ein, um die Liste der Tabellen zu filtern. Die Suche ist nicht groß-/kleinschreibungsempfindlich. Wenn Tabellen bereits innerhalb der Tabelle angezeigt werden, werden die Tabellenergebnisse in Echtzeit mit jedem Tastendruck gefiltert. Um Tabellen vom Endpunkt beim Suchen neu zu laden, geben Sie Suchkriterien ein und aktualisieren Sie dann, wie unten beschrieben.
Aktualisieren: Klicken Sie auf das Aktualisierungssymbol oder das Wort Aktualisieren, um Tabellen vom Google BigQuery-Endpunkt neu zu laden. Dies kann nützlich sein, wenn Tabellen zu Google BigQuery hinzugefügt wurden. Diese Aktion aktualisiert alle Metadaten, die zum Erstellen der Tabelle der Tabellen verwendet werden, die in der Konfiguration angezeigt wird.
Tabelle auswählen: Klicken Sie innerhalb der Tabelle auf eine beliebige Stelle in einer Zeile, um eine Tabelle auszuwählen. Es kann nur eine Tabelle ausgewählt werden. Die für jede Tabelle verfügbaren Informationen werden vom Google BigQuery-Endpunkt abgerufen:
- Name: Der Name der Tabelle.
- Beschreibung: Die Beschreibung der Tabelle.
Tipp

Wenn die Tabelle nicht mit verfügbaren Tabellen gefüllt wird, könnte die Google BigQuery-Verbindung nicht erfolgreich sein. Stellen Sie sicher, dass Sie verbunden sind, indem Sie die Verbindung erneut öffnen und die Anmeldeinformationen erneut testen.
Anzeigename: Legen Sie einen Anzeigenamen für den Datentransfer fest.
Zurück: Klicken Sie, um die Konfiguration für diesen Schritt vorübergehend zu speichern und zum vorherigen Schritt zurückzukehren.
Weiter: Klicken Sie, um die Konfiguration für diesen Schritt vorübergehend zu speichern und zum nächsten Schritt fortzufahren. Die Konfiguration wird nicht gespeichert, bis Sie auf die Schaltfläche Fertig im letzten Schritt klicken.
Änderungen verwerfen: Nach Änderungen klicken Sie, um die Konfiguration zu schließen, ohne die vorgenommenen Änderungen zu speichern. Eine Nachricht fordert Sie auf, zu bestätigen, dass Sie die Änderungen verwerfen möchten.

Schritt 4: Überprüfen der Datenschemas

Alle Anforderungs- oder Antwortschemas werden angezeigt. Jedes Benutzeroberflächenelement dieses Schrittes wird im Folgenden beschrieben.

Google BigQuery-Datenübertragungsaktivitätskonfiguration Schritt 4

Datenschemas: Diese Datenschemas werden von angrenzenden Transformationen geerbt und während der Transformationszuordnung erneut angezeigt.

Der Google BigQuery-Connector verwendet die Google SDK-Version 25.4.0. Weitere Informationen zu den Schema-Knoten und -Feldern finden Sie in der SDK-Dokumentation.

Wichtig

Der Wert, der für das Feld custom_schedule verwendet wird, sollte eine Zeichenkette sein, die dem Format entspricht, das in der Dokumentation von Google zu Jobs mit cron.yml planen definiert ist, ohne schedule: davor zu setzen. Zum Beispiel alle 12 Stunden oder jeden Montag um 09:00.

Die Datenübertragungs-Aktivität verwendet JSON sowohl in ihren Anfrage- als auch in ihren Antwortschemata.
Aktualisieren: Klicken Sie auf das Aktualisierungssymbol oder das Wort Aktualisieren, um Schemata vom Google BigQuery-Endpunkt neu zu generieren. Diese Aktion regeneriert auch ein Schema an anderen Stellen im Projekt, an denen dasselbe Schema referenziert wird, wie in einer angrenzenden Transformation.
Zurück: Klicken Sie, um die Konfiguration für diesen Schritt vorübergehend zu speichern und zum vorherigen Schritt zurückzukehren.
Fertig: Klicken Sie, um die Konfiguration für alle Schritte zu speichern und die Aktivitätskonfiguration zu schließen.
Änderungen verwerfen: Nach Änderungen klicken Sie, um die Konfiguration zu schließen, ohne die an einem Schritt vorgenommenen Änderungen zu speichern. Eine Nachricht fragt Sie, ob Sie die Änderungen wirklich verwerfen möchten.

Nächste Schritte

Nachdem Sie eine Google BigQuery Datenübertragungs-Aktivität konfiguriert haben, vervollständigen Sie die Konfiguration des Vorgangs, indem Sie andere Aktivitäten oder Werkzeuge als Vorgangsschritte hinzufügen und konfigurieren. Sie können auch die Betriebseinstellungen konfigurieren, die die Möglichkeit umfassen, Vorgänge zusammenzuführen, die sich in denselben oder unterschiedlichen Workflows befinden.

Menüaktionen für eine Aktivität sind im Projektbereich und auf der Entwurfsgrafik zugänglich. Für Details siehe das Aktivitätsaktionsmenü in den Connector-Grundlagen.

Google BigQuery Datenübertragungs-Aktivitäten können als Ziel mit diesen Vorgangs Mustern verwendet werden:

Transformationsmuster
Zwei-Transformationsmuster (als erstes oder zweites Ziel)

Um die Aktivität mit Skriptfunktionen zu verwenden, schreiben Sie die Daten an einen temporären Speicherort und verwenden Sie dann diesen temporären Speicherort in der Skriptfunktion.

Wenn Sie bereit sind, setzen Sie die Operation ein und führen Sie sie aus und validieren Sie das Verhalten, indem Sie die Betriebsprotokolle überprüfen.