Apache Parquet Verbindung
Einführung
Eine Apache Parquet Verbindung, die mit dem Apache Parquet Connector erstellt wurde, stellt den Zugriff auf Apache Parquet her. Sobald diese Aktivitäten konfiguriert sind, interagieren sie über die Verbindung mit Apache Parquet.
Erstellen oder Bearbeiten einer Apache Parquet Verbindung
Eine neue Apache Parquet Verbindung wird mit dem Apache Parquet Connector von einem dieser Standorte aus erstellt:
- Die Tab Endpoints und -konnektoren der Designkomponentenpalette (siehe Komponentenpalette).
- Die Seite Globale Verbindungen (siehe Einen globalen Endpoint erstellen in Globale Verbindungen).
Eine vorhandene Apache Parquet Verbindung kann von diesen Orten aus bearbeitet werden:
- Die Tab Endpoints und -konnektoren der Designkomponentenpalette (siehe Komponentenpalette).
- Die Tab Komponenten des Projektbereichs (siehe Aktionsmenü im Projektbereich Tab Komponenten).
- Die Seite Globale Verbindungen (siehe Einen globalen Endpoint bearbeiten in Globale Verbindungen).
Konfigurieren einer Apache Parquet Verbindung
Jedes Benutzeroberflächenelement des Apache Parquet Verbindungskonfigurationsbildschirms wird unten beschrieben.
Tipp
Felder mit variablem Symbol Unterstützung der Verwendung von globalen Variablen, Projektvariablen und Jitterbit-Variablen. Beginnen Sie entweder mit einer öffnenden eckigen Klammer [
in das Feld oder durch Klicken auf das Variablensymbol, um eine Liste der vorhandenen Variablen anzuzeigen, aus denen Sie auswählen können.
-
Verbindungsname: Geben Sie einen Namen ein, der zur Identifizierung der Verbindung verwendet werden soll. Der Name muss für jede Apache Parquet Verbindung eindeutig sein und darf keine Schrägstriche enthalten (
/
) oder Doppelpunkte (:
). Dieser Name wird auch verwendet, um den Apache Parquet Endpoint zu identifizieren, der sich sowohl auf eine bestimmte Verbindung als auch auf ihre Aktivitäten bezieht. -
URI: Geben Sie die URI ein.
-
Verbindungstyp: Wählen Sie einen der folgenden Verbindungstypen:
-
Auto
-
Lokal
-
Amazon S3
-
Azure Blob-Speicher
-
Azure Data Lake Storage Gen1
-
Azure Data Lake Storage Gen2
-
Azure Data Lake Storage Gen2 SSL
-
Azure Dateien
-
Box
-
Dropbox
-
FTP
-
FTPS
-
Google Cloud Storage
-
Google Drive
-
HDFS
-
HDFS sicher
-
HTTP
-
HTTPS
-
IBM Object Storage-Quelle
-
OneDrive
-
Ein See
-
Oracle Cloud-Speicher
-
SFTP
-
SharePoint REST
-
SharePoint-SOAP
Weitere Informationen zu Verbindungstypen finden Sie in den Apache Parquet Verbindungsdetails Seite.
-
-
Datenmodell: Wählen Sie das Datenmodell aus, eines von:
-
Keines
-
Dokument
-
FlattenedDocuments
-
Relational
-
-
OAuth-Zuweisungstyp: Wählen Sie den OAuth-Zuweisungstyp aus, einen von:
-
CODE
-
CLIENT
-
PASSWORT
-
-
Aggregatdateien: Wenn ausgewählt, wird angegeben, dass Aggregatdateien verwendet werden sollen.
-
Proxyeinstellungen verwenden: Wählen Sie aus, ob private Agent-Proxyeinstellungen verwendet werden sollen.
-
Erweiterte Konfigurationen: Wenn ausgewählt, wird die Tabelle Erweiterte Konfigurationseigenschaften angezeigt, die zum Hinzufügen zusätzlicher Konfigurationseigenschaften verwendet wird als Key-Value Paare.
- Hinzufügen: Fügt der Tabelle eine Zeile hinzu. Geben Sie für jede Eigenschaft ein Key-Value Paar ein.
- Senden: Speichert das Key-Value Paar in der Tabelle. Sichtbar, wenn Sie im Bearbeitungsmodus mit der Maus über eine Zeile fahren.
- Verwerfen: Verwirft eine neue Zeile oder alle Änderungen an einer vorhandenen Zeile. Sichtbar, wenn Sie im Bearbeitungsmodus mit der Maus über eine Zeile fahren.
- Bearbeiten: Ermöglicht Ihnen, ein vorhandenes Key-Value Paar zu bearbeiten. Sichtbar, wenn Sie mit der Maus über eine vorhandene Zeile fahren.
- Löschen: Löscht die Zeile aus der Tabelle. Sichtbar, wenn der Mauszeiger über eine vorhandene Zeile fährt.
- Alles löschen: Löscht alle Zeilen aus der Tabelle.
Wichtig
Felder in der Tabelle Erweiterte Konfigurationen zeigen das variable Symbol nur im Bearbeitungsmodus. Damit die Variablenwerte dieser Felder zur Laufzeit ausgefüllt werden, muss die Agentenversion mindestens 10.75 / 11.13 sein.
-
Test: Klicken Sie hier, um die Verbindung mit der angegebenen Konfiguration zu überprüfen. Wenn die Verbindung getestet wird, wird die neueste Version des Connectors von den Agenten in der Agentengruppe heruntergeladen, die der aktuellen Umfeld zugeordnet ist. Dieser Connector unterstützt das Anhalten des Downloads der neuesten Connector-Version mithilfe der Organisationsrichtlinie Automatische Connector-Aktualisierung deaktivieren.
-
Änderungen speichern: Klicken Sie hier, um die Verbindungskonfiguration zu speichern und zu schließen.
-
Änderungen verwerfen: Klicken Sie nach dem Vornehmen von Änderungen an einer neuen oder vorhandenen Konfiguration hier, um die Konfiguration ohne Speichern zu schließen. Sie werden in einer Meldung aufgefordert, zu bestätigen, dass Sie die Änderungen verwerfen möchten.
-
Löschen: Klicken Sie nach dem Öffnen einer vorhandenen Verbindungskonfiguration hier, um die Verbindung dauerhaft aus dem Projekt zu löschen und die Konfiguration zu schließen (siehe Komponentenabhängigkeiten, Löschen und Entfernen). Sie werden in einer Meldung aufgefordert, zu bestätigen, dass Sie die Verbindung löschen möchten.
Konfigurieren von OAuth-Verbindungen
Dieser Connector unterstützt eine Verbindung über OAuth durch die Verwendung bestimmter Konfigurationseigenschaften. Nachdem Sie ein Authentifizierungsschema ausgewählt haben, das OAuth initiieren enthält, können Sie die Konfiguration in den angezeigten Feldern angeben.
Notiz
Um die OAuth-Authentifizierung erfolgreich abzuschließen, sind möglicherweise zusätzliche IDs, Geheimnisse, Bereiche und andere Authentifizierungstoken erforderlich. Weitere Informationen zu den Anforderungen finden Sie in der Endpoint.
Für diesen Connector werden zwei Szenarien unterstützt. In beiden Szenarien müssen Sie ein Drittpartei verwenden (z. B. Postman oder ein ähnliches Tool), um das oder die erforderlichen Zugriffstoken vom betreffenden Endpoint abzurufen. Beide Szenarien funktionieren nur für Einzelagentengruppen. Dabei handelt es sich um Agentengruppen, die aus einem einzelnen Agenten bestehen.
-
Szenario 1: Verwenden eines OAuth-Zugriffstokens, das nach einer festgelegten Zeit abläuft.
Mit dieser Konfiguration geben Sie ein OAuth-Zugriffstoken an, das für einen festgelegten Zeitraum gültig ist, der vom jeweiligen Endpoint bestimmt wird. Der Connector verwendet das Token, um die Verbindung herzustellen. Die Verbindung funktioniert jedoch nicht mehr, sobald das Zugriffstoken abläuft. Sie konfigurieren den Connector für die Verwendung des Tokens, indem Sie diese Eigenschaften festlegen:
Konfigurationseigenschaft Wert OAuth initiieren OFF
OAuth-Zugriffstoken Auf den Wert des vom Endpoint erhaltenen OAuth-Zugriffstokens eingestellt -
Szenario 2: Verwenden eines OAuth-Zugriffstokens in Kombination mit einem OAuth-Aktualisierungstoken, um die automatische Aktualisierung des Zugriffs zu ermöglichen.
Mit dieser Konfiguration verwendet der Connector ein Aktualisierungstoken, um ein neues Zugriffstoken zu erhalten, sobald das aktuelle Zugriffstoken abgelaufen ist. Dies ist im Allgemeinen die beste Methode zum Konfigurieren von OAuth.
Sie geben ein OAuth-Zugriffstoken und ein OAuth-Aktualisierungstoken an, je nach dem jeweiligen Endpoint. Sie konfigurieren den Connector für die Verwendung dieser Token, indem Sie die folgenden Eigenschaften festlegen:
Konfigurationseigenschaft Wert OAuth initiieren REFRESH
OAuth-Zugriffstoken Auf den Wert des vom Endpoint erhaltenen OAuth-Zugriffstokens eingestellt OAuth-Aktualisierungstoken Auf den Wert des vom Endpoint erhaltenen OAuth-Aktualisierungstokens eingestellt
Notiz
Wenn Sie mehrere OAuth-basierte Apache Parquet Verbindungen auf demselben privaten Agenten verwenden, legen Sie die Konfigurationseigenschaft fest OAuthSettingsLocation
zu einem eindeutigen beschreibbaren Agentenpfad für jede Verbindung. Im jitterbit.conf
Datei für den Agenten, legen Sie EnableLocalFileLocation=true
. Wenn Sie diese beiden Schritte nicht ausführen, verwenden die mehreren Verbindungen denselben Standardpfad und überschreiben sich gegenseitig.
Nächste Schritte
Nachdem eine Apache Parquet Connector-Verbindung hergestellt wurde, platzieren Sie einen Aktivitätstyp auf der Design-Canvas, um Aktivitätsinstanzen zu erstellen, die entweder als Quellen (zum Bereitstellen von Daten in einem Operation) oder als Ziele (zum Verwenden von Daten in einem Operation) verwendet werden können.
Menüaktionen für eine Verbindung und ihre Aktivitätstypen sind über den Projektbereich und die Design-Komponentenpalette zugänglich. Weitere Informationen finden Sie unter Aktionsmenüs in Connector-Grundlagen.
Diese Aktivitätstypen sind verfügbar:
-
Abfrage: Ruft Datensätze aus einer Tabelle bei Apache Parquet ab und ist zur Verwendung als Quelle in einer Operation vorgesehen.
-
Erstellen: Fügt einen Datensatz in eine Tabelle bei Apache Parquet ein und ist als Ziel in einer Operation vorgesehen.
-
Ausführen: Führt eine Prozedur bei Apache Parquet aus und ist zur Verwendung als Ziel in einer Operation vorgesehen.