Google BigQuery Datensatz einfügen Aktivität
Einführung
Eine Google BigQuery Datensatz einfügen Aktivität, die ihre Google BigQuery Verbindung verwendet, fügt Datensätze in eine Tabelle in Google BigQuery ein und ist als Ziel gedacht, um Daten in einer Operation zu konsumieren.
Erstellen einer Google BigQuery Datensatz einfügen Aktivität
Eine Instanz einer Google BigQuery Datensatz einfügen Aktivität wird aus einer Google BigQuery Verbindung unter Verwendung des Aktivitätstyps Datensatz einfügen erstellt.
Um eine Instanz einer Aktivität zu erstellen, ziehen Sie den Aktivitätstyp auf die Entwurfsfläche oder kopieren Sie den Aktivitätstyp und fügen Sie ihn auf der Entwurfsfläche ein. Für Details siehe Erstellen einer Aktivitäts- oder Toolinstanz in Komponentenwiederverwendung.
Eine vorhandene Google BigQuery Datensatz einfügen Aktivität kann von diesen Orten aus bearbeitet werden:
- Die Entwurfsfläche (siehe Komponentenaktionsmenü in Entwurfsfläche).
- Der Komponenten Tab im Projektbereich (siehe Komponentenaktionsmenü in Projektbereich Komponenten Tab).
Konfigurieren einer Google BigQuery Datensatz einfügen Aktivität
Befolgen Sie diese Schritte, um eine Google BigQuery Datensatz einfügen Aktivität zu konfigurieren:
-
Schritt 1: Geben Sie einen Namen ein und wählen Sie das Dataset aus
Geben Sie einen Namen für die Aktivität ein und wählen Sie das Dataset aus. -
Schritt 2: Wählen Sie die Tabelle aus
Wählen Sie die Tabelle aus. -
Schritt 3: Überprüfen Sie die Datenschemas
Alle Anfrage- oder Antwortschemata werden angezeigt.
Schritt 1: Geben Sie einen Namen ein und wählen Sie das Dataset aus
In diesem Schritt geben Sie einen Namen für die Aktivität ein und wählen das Dataset aus. Jedes Benutzeroberflächenelement dieses Schrittes wird im Folgenden beschrieben.
-
Name: Geben Sie einen Namen ein, um die Aktivität zu identifizieren. Der Name muss für jede Google BigQuery Insert Record-Aktivität eindeutig sein und darf keine Schrägstriche
/oder Doppelpunkte:enthalten. -
Dataset auswählen: In diesem Abschnitt werden die in der Google BigQuery-Schnittstelle verfügbaren Datasets angezeigt.
-
Ausgewähltes Dataset: Nachdem ein Dataset ausgewählt wurde, wird es hier aufgelistet.
-
Suche: Geben Sie den Wert einer beliebigen Spalte in das Suchfeld ein, um die Liste der Datasets zu filtern. Die Suche ist nicht groß-/kleinschreibungsempfindlich. Wenn Datasets bereits in der Tabelle angezeigt werden, werden die Tabellenergebnisse in Echtzeit mit jedem Tastendruck gefiltert. Um Datasets von der Schnittstelle beim Suchen neu zu laden, geben Sie Suchkriterien ein und aktualisieren Sie dann, wie unten beschrieben.
-
Aktualisieren: Klicken Sie auf das Aktualisierungssymbol oder das Wort Aktualisieren, um Datasets von der Google BigQuery-Schnittstelle neu zu laden. Dies kann nützlich sein, wenn Datasets zu Google BigQuery hinzugefügt wurden. Diese Aktion aktualisiert alle Metadaten, die zum Erstellen der in der Konfiguration angezeigten Tabelle der Datasets verwendet werden.
-
Ein Dataset auswählen: Klicken Sie innerhalb der Tabelle auf eine beliebige Stelle in einer Zeile, um ein Dataset auszuwählen. Es kann nur ein Dataset ausgewählt werden. Die Informationen, die für jedes Dataset verfügbar sind, werden von der Google BigQuery-Schnittstelle abgerufen:
-
Name: Der Name des Datasets.
-
Beschreibung: Die Beschreibung des Datasets.
-
Tipp
Wenn die Tabelle nicht mit verfügbaren Datasets gefüllt wird, könnte die Google BigQuery-Verbindung nicht erfolgreich sein. Stellen Sie sicher, dass Sie verbunden sind, indem Sie die Verbindung erneut öffnen und die Anmeldeinformationen erneut testen.
-
-
Einfüge-Strategie: Wählen Sie die Einfüge-Strategie aus. Die Standardauswahl ist Einzelne Datensätze pro INSERT-Anweisung einfügen. Wenn Sie jedoch mit großen Datasets und einem hohen Volumen an einzufügenden Datensätzen arbeiten, wählen Sie Alle Datensätze in einer einzigen INSERT-Anweisung einfügen.
-
Continue on error: (Sichtbar nur wenn die Einfüge-Strategie ausgewählt wurde, die Einfügen eines Datensatzes pro INSERT-Anweisung ist.) Wählen Sie diese Option, um die Ausführung der Aktivität fortzusetzen, wenn ein Fehler für einen Datensatz in einer Batch-Anfrage auftritt. Wenn Fehler auftreten, werden diese im Betriebsprotokoll aufgezeichnet.
-
Save & Exit: Wenn aktiviert, klicken Sie, um die Konfiguration für diesen Schritt zu speichern und die Aktivitätskonfiguration zu schließen.
-
Next: Klicken Sie, um die Konfiguration für diesen Schritt vorübergehend zu speichern und zum nächsten Schritt fortzufahren. Die Konfiguration wird nicht gespeichert, bis Sie die Schaltfläche Fertig im letzten Schritt klicken.
-
Discard Changes: Nach Änderungen klicken Sie, um die Konfiguration zu schließen, ohne die vorgenommenen Änderungen zu speichern. Eine Nachricht fragt Sie, ob Sie die Änderungen verwerfen möchten.
Schritt 2: Wählen Sie die Tabelle
In diesem Schritt wählen Sie die Tabelle aus. Jedes Benutzeroberflächenelement dieses Schrittes wird im Folgenden beschrieben.
-
Wählen Sie die Tabelle: Dieser Abschnitt zeigt die in der Google BigQuery-Schnittstelle verfügbaren Tabellen an.
-
Selected Dataset: Das im vorherigen Schritt ausgewählte Dataset wird hier aufgelistet.
-
Selected Table: Nachdem eine Tabelle ausgewählt wurde, wird sie hier aufgelistet.
-
Search: Geben Sie den Wert einer beliebigen Spalte in das Suchfeld ein, um die Liste der Tabellen zu filtern. Die Suche ist nicht groß-/kleinschreibungsempfindlich. Wenn Tabellen bereits innerhalb der Tabelle angezeigt werden, werden die Tabellenergebnisse in Echtzeit mit jedem Tastendruck gefiltert. Um Tabellen von der Schnittstelle beim Suchen neu zu laden, geben Sie Suchkriterien ein und aktualisieren Sie dann, wie unten beschrieben.
-
Refresh: Klicken Sie auf das Aktualisierungssymbol oder das Wort Aktualisieren, um Tabellen von der Google BigQuery-Schnittstelle neu zu laden. Dies kann nützlich sein, wenn Tabellen zu Google BigQuery hinzugefügt wurden. Diese Aktion aktualisiert alle Metadaten, die zum Erstellen der in der Konfiguration angezeigten Tabelle von Tabellen verwendet werden.
-
Selecting a Table: Klicken Sie innerhalb der Tabelle auf eine beliebige Zeile, um eine Tabelle auszuwählen. Es kann nur eine Tabelle ausgewählt werden. Die für jede Tabelle verfügbaren Informationen werden von der Google BigQuery-Schnittstelle abgerufen:
-
Name: Der Name der Tabelle.
-
Description: Die Beschreibung der Tabelle.
-
Tipp
Wenn die Tabelle nicht mit verfügbaren Tabellen gefüllt wird, könnte die Google BigQuery-Verbindung nicht erfolgreich sein. Stellen Sie sicher, dass Sie verbunden sind, indem Sie die Verbindung erneut öffnen und die Anmeldeinformationen erneut testen.
-
-
Back: Klicken Sie, um die Konfiguration für diesen Schritt vorübergehend zu speichern und zum vorherigen Schritt zurückzukehren.
-
Next: Klicken Sie, um die Konfiguration für diesen Schritt vorübergehend zu speichern und zum nächsten Schritt fortzufahren. Die Konfiguration wird nicht gespeichert, bis Sie die Schaltfläche Fertig im letzten Schritt klicken.
-
Discard Changes: Nachdem Sie Änderungen vorgenommen haben, klicken Sie, um die Konfiguration zu schließen, ohne die Änderungen an einem Schritt zu speichern. Eine Nachricht fragt Sie, ob Sie die Änderungen wirklich verwerfen möchten.
Schritt 3: Überprüfen Sie die Datenschemata
Alle Anforderungs- oder Antwortschemata werden angezeigt. Jedes Benutzeroberflächenelement dieses Schrittes wird im Folgenden beschrieben.
-
Data Schemas: Diese Datenschemata werden von angrenzenden Transformationen geerbt und während der Transformation Mapping erneut angezeigt.
Der Google BigQuery-Connector verwendet die Google BigQuery REST API. Weitere Informationen zu den Schema-Knoten und -Feldern finden Sie in der API-Dokumentation.
Die Insert Record-Aktivität verwendet JSON sowohl in ihren Anforderungs- als auch in ihren Antwortschemata.
-
Refresh: Klicken Sie auf das Aktualisierungssymbol oder das Wort Aktualisieren, um die Schemata vom Google BigQuery-Endpunkt neu zu generieren. Diese Aktion regeneriert auch ein Schema an anderen Stellen im Projekt, an denen dasselbe Schema referenziert wird, z. B. in einer angrenzenden Transformation.
-
Back: Klicken Sie, um die Konfiguration für diesen Schritt vorübergehend zu speichern und zum vorherigen Schritt zurückzukehren.
-
Finished: Klicken Sie, um die Konfiguration für alle Schritte zu speichern und die Aktivitätskonfiguration zu schließen.
-
Discard Changes: Nachdem Sie Änderungen vorgenommen haben, klicken Sie, um die Konfiguration zu schließen, ohne die Änderungen an einem Schritt zu speichern. Eine Nachricht fragt Sie, ob Sie die Änderungen wirklich verwerfen möchten.
Nächste Schritte
Nachdem Sie eine Google BigQuery Datensatz einfügen-Aktivität konfiguriert haben, vervollständigen Sie die Konfiguration des Vorgangs, indem Sie weitere Aktivitäten oder Werkzeuge als Vorgangsschritte hinzufügen und konfigurieren. Sie können auch die Betriebseinstellungen konfigurieren, die die Möglichkeit umfassen, Vorgänge zusammenzuführen, die sich in denselben oder unterschiedlichen Workflows befinden.
Menüaktionen für eine Aktivität sind im Projektbereich und auf der Entwurfsgrafik zugänglich. Für Details siehe Aktivitätsaktionsmenü in Connector-Grundlagen.
Google BigQuery Datensatz einfügen-Aktivitäten können als Ziel mit diesen Vorgangsmustern verwendet werden:
- Transformationsmuster
- Zwei-Transformationsmuster (als erstes oder zweites Ziel)
Um die Aktivität mit Skriptfunktionen zu verwenden, schreiben Sie die Daten an einen temporären Speicherort und verwenden Sie dann diesen temporären Speicherort in der Skriptfunktion.
Wenn Sie bereit sind, setzen Sie den Vorgang ein und führen Sie ihn aus und validieren Sie das Verhalten, indem Sie die Vorgangsprotokolle überprüfen.