Google BigQuery Datensatz einfügen Aktivität
Einführung
Eine Google BigQuery Datensatz einfügen Aktivität, die ihre Google BigQuery Verbindung verwendet, fügt Datensätze in eine Tabelle in Google BigQuery ein und ist als Ziel gedacht, um Daten in einem Vorgang zu konsumieren.
Erstellen einer Google BigQuery Datensatz einfügen Aktivität
Eine Instanz einer Google BigQuery Datensatz einfügen Aktivität wird aus einer Google BigQuery Verbindung unter Verwendung des Aktivitätstyps Datensatz einfügen erstellt.
Um eine Instanz einer Aktivität zu erstellen, ziehen Sie den Aktivitätstyp auf die Entwurfsfläche oder kopieren Sie den Aktivitätstyp und fügen Sie ihn auf der Entwurfsfläche ein. Weitere Informationen finden Sie unter Erstellen einer Aktivitäts- oder Toolinstanz in Komponentenwiederverwendung.
Eine vorhandene Google BigQuery Datensatz einfügen Aktivität kann von diesen Orten aus bearbeitet werden:
- Die Entwurfsfläche (siehe Komponentenaktionsmenü in Entwurfsfläche).
- Der Komponenten-Tab im Projektbereich (siehe Komponentenaktionsmenü in Projektbereich Komponenten-Tab).
Konfigurieren einer Google BigQuery Datensatz einfügen Aktivität
Befolgen Sie diese Schritte, um eine Google BigQuery Datensatz einfügen Aktivität zu konfigurieren:
-
Schritt 1: Geben Sie einen Namen ein und wählen Sie das Dataset aus
Geben Sie einen Namen für die Aktivität ein und wählen Sie das Dataset aus. -
Schritt 2: Wählen Sie die Tabelle aus
Wählen Sie die Tabelle aus. -
Schritt 3: Überprüfen Sie die Datenschemas
Alle Anfrage- oder Antwortschemas werden angezeigt.
Schritt 1: Geben Sie einen Namen ein und wählen Sie das Dataset aus
In diesem Schritt geben Sie einen Namen für die Aktivität ein und wählen das Dataset aus. Jedes Benutzeroberflächenelement dieses Schrittes wird im Folgenden beschrieben.
-
Name: Geben Sie einen Namen ein, um die Aktivität zu identifizieren. Der Name muss für jede Google BigQuery Insert Record-Aktivität eindeutig sein und darf keine Schrägstriche
/
oder Doppelpunkte:
enthalten. -
Dataset auswählen: In diesem Abschnitt werden die in der Google BigQuery-Schnittstelle verfügbaren Datasets angezeigt.
-
Ausgewähltes Dataset: Nachdem ein Dataset ausgewählt wurde, wird es hier aufgelistet.
-
Suche: Geben Sie den Wert einer beliebigen Spalte in das Suchfeld ein, um die Liste der Datasets zu filtern. Die Suche ist nicht groß-/kleinschreibungsempfindlich. Wenn Datasets bereits in der Tabelle angezeigt werden, werden die Tabellenergebnisse in Echtzeit mit jedem Tastendruck gefiltert. Um Datasets von der Schnittstelle beim Suchen neu zu laden, geben Sie Suchkriterien ein und aktualisieren Sie dann, wie unten beschrieben.
-
Aktualisieren: Klicken Sie auf das Aktualisierungssymbol oder das Wort Aktualisieren, um Datasets von der Google BigQuery-Schnittstelle neu zu laden. Dies kann nützlich sein, wenn Datasets zu Google BigQuery hinzugefügt wurden. Diese Aktion aktualisiert alle Metadaten, die zum Erstellen der in der Konfiguration angezeigten Tabelle der Datasets verwendet werden.
-
Ein Dataset auswählen: Klicken Sie innerhalb der Tabelle auf eine beliebige Stelle in einer Zeile, um ein Dataset auszuwählen. Es kann nur ein Dataset ausgewählt werden. Die für jedes Dataset verfügbaren Informationen werden von der Google BigQuery-Schnittstelle abgerufen:
-
Name: Der Name des Datasets.
-
Beschreibung: Die Beschreibung des Datasets.
-
Tipp
Wenn die Tabelle nicht mit verfügbaren Datasets gefüllt wird, könnte die Google BigQuery-Verbindung nicht erfolgreich sein. Stellen Sie sicher, dass Sie verbunden sind, indem Sie die Verbindung erneut öffnen und die Anmeldeinformationen erneut testen.
-
-
Einfüge-Strategie: Wählen Sie die Einfüge-Strategie aus. Die Standardauswahl ist Einzelne Datensätze pro INSERT-Anweisung einfügen. Wenn Sie jedoch mit großen Datasets und einem hohen Volumen an einzufügenden Datensätzen arbeiten, wählen Sie Alle Datensätze in einer einzigen INSERT-Anweisung einfügen.
-
Continue on error: (Sichtbar nur wenn die Einfüge-Strategie ausgewählt wurde, die Einfügen eines Datensatzes pro INSERT-Anweisung war.) Wählen Sie diese Option, um die Ausführung der Aktivität fortzusetzen, wenn ein Fehler für einen Datensatz in einer Batch-Anfrage auftritt. Wenn Fehler auftreten, werden diese im Betriebsprotokoll aufgezeichnet.
-
Save & Exit: Wenn aktiviert, klicken Sie, um die Konfiguration für diesen Schritt zu speichern und die Aktivitätskonfiguration zu schließen.
-
Next: Klicken Sie, um die Konfiguration für diesen Schritt vorübergehend zu speichern und zum nächsten Schritt fortzufahren. Die Konfiguration wird nicht gespeichert, bis Sie die Schaltfläche Fertig im letzten Schritt klicken.
-
Discard Changes: Nach Änderungen klicken Sie, um die Konfiguration zu schließen, ohne die vorgenommenen Änderungen an einem Schritt zu speichern. Eine Nachricht fragt Sie, ob Sie die Änderungen verwerfen möchten.
Step 2: Select the table
In diesem Schritt wählen Sie die Tabelle aus. Jedes Benutzeroberflächenelement dieses Schrittes wird unten beschrieben.
-
Select the Table: Dieser Abschnitt zeigt die in der Google BigQuery-Endpunkt verfügbaren Tabellen an.
-
Selected Dataset: Das im vorherigen Schritt ausgewählte Dataset wird hier aufgelistet.
-
Selected Table: Nachdem eine Tabelle ausgewählt wurde, wird sie hier aufgelistet.
-
Search: Geben Sie den Wert einer beliebigen Spalte in das Suchfeld ein, um die Liste der Tabellen zu filtern. Die Suche ist nicht groß-/kleinschreibungssensitiv. Wenn Tabellen bereits innerhalb der Tabelle angezeigt werden, werden die Tabellenergebnisse in Echtzeit mit jedem Tastendruck gefiltert. Um Tabellen vom Endpunkt beim Suchen neu zu laden, geben Sie Suchkriterien ein und aktualisieren Sie dann, wie unten beschrieben.
-
Refresh: Klicken Sie auf das Aktualisierungssymbol oder das Wort Aktualisieren, um Tabellen vom Google BigQuery-Endpunkt neu zu laden. Dies kann nützlich sein, wenn Tabellen zu Google BigQuery hinzugefügt wurden. Diese Aktion aktualisiert alle Metadaten, die zum Erstellen der in der Konfiguration angezeigten Tabelle von Tabellen verwendet werden.
-
Tabelle auswählen: Klicken Sie innerhalb der Tabelle auf eine Zeile, um eine Tabelle auszuwählen. Es kann nur eine Tabelle ausgewählt werden. Die Informationen, die für jede Tabelle verfügbar sind, werden vom Google BigQuery-Endpunkt abgerufen:
-
Name: Der Name der Tabelle.
-
Beschreibung: Die Beschreibung der Tabelle.
-
Tipp
Wenn die Tabelle nicht mit verfügbaren Tabellen gefüllt wird, könnte die Google BigQuery-Verbindung nicht erfolgreich sein. Stellen Sie sicher, dass Sie verbunden sind, indem Sie die Verbindung erneut öffnen und die Anmeldeinformationen erneut testen.
-
-
Zurück: Klicken Sie, um die Konfiguration für diesen Schritt vorübergehend zu speichern und zum vorherigen Schritt zurückzukehren.
-
Weiter: Klicken Sie, um die Konfiguration für diesen Schritt vorübergehend zu speichern und mit dem nächsten Schritt fortzufahren. Die Konfiguration wird nicht gespeichert, bis Sie die Schaltfläche Fertig im letzten Schritt klicken.
-
Änderungen verwerfen: Nachdem Sie Änderungen vorgenommen haben, klicken Sie, um die Konfiguration zu schließen, ohne die Änderungen an einem Schritt zu speichern. Eine Nachricht fragt Sie, ob Sie die Änderungen wirklich verwerfen möchten.
Schritt 3: Überprüfen der Datenschemas
Alle Anforderungs- oder Antwortschemas werden angezeigt. Jedes Benutzeroberflächenelement dieses Schrittes wird im Folgenden beschrieben.
-
Datenschemas: Diese Datenschemas werden von angrenzenden Transformationen geerbt und während der Transformation-Mapping erneut angezeigt.
Der Google BigQuery-Connector verwendet die Google SDK-Version 25.4.0. Weitere Informationen zu den Schema-Knoten und -Feldern finden Sie in der SDK-Dokumentation.
Die Insert Record-Aktivität verwendet JSON sowohl in ihren Anforderungs- als auch in ihren Antwortschemas.
-
Aktualisieren: Klicken Sie auf das Aktualisierungssymbol oder das Wort Aktualisieren, um die Schemata vom Google BigQuery-Endpunkt neu zu generieren. Diese Aktion regeneriert auch ein Schema an anderen Stellen im Projekt, an denen dasselbe Schema referenziert wird, wie z. B. in einer angrenzenden Transformation.
-
Zurück: Klicken Sie, um die Konfiguration für diesen Schritt vorübergehend zu speichern und zum vorherigen Schritt zurückzukehren.
-
Fertig: Klicken Sie, um die Konfiguration für alle Schritte zu speichern und die Aktivitätskonfiguration zu schließen.
-
Änderungen verwerfen: Nachdem Sie Änderungen vorgenommen haben, klicken Sie, um die Konfiguration zu schließen, ohne die Änderungen an einem Schritt zu speichern. Eine Nachricht fordert Sie auf, zu bestätigen, dass Sie die Änderungen verwerfen möchten.
Nächste Schritte
Nachdem Sie eine Google BigQuery Datensatz einfügen-Aktivität konfiguriert haben, vervollständigen Sie die Konfiguration des Vorgangs, indem Sie andere Aktivitäten oder Werkzeuge als Vorgangsschritte hinzufügen und konfigurieren. Sie können auch die Betriebseinstellungen konfigurieren, die die Möglichkeit umfassen, Vorgänge zusammenzuführen, die sich in denselben oder unterschiedlichen Workflows befinden.
Menüaktionen für eine Aktivität sind im Projektbereich und auf der Entwurfsgrafik zugänglich. Für Details siehe Aktivitätsaktionsmenü in Connector-Grundlagen.
Google BigQuery Datensatz einfügen-Aktivitäten können als Ziel mit diesen Vorgangsmustern verwendet werden:
- Transformationsmuster
- Zwei-Transformationsmuster (als erstes oder zweites Ziel)
Um die Aktivität mit Skriptfunktionen zu verwenden, schreiben Sie die Daten an einen temporären Speicherort und verwenden Sie dann diesen temporären Speicherort in der Skriptfunktion.
Wenn Sie bereit sind, bereitstellen und ausführen Sie den Vorgang und validieren Sie das Verhalten, indem Sie die Vorgangsprotokolle überprüfen.